详解springboot+atomikos+druid 数据库连接失效分析

更新时间:2023-04-04 22:43:18 阅读：评论：0

一、起因

　　最近查看系统的后台日志，经常发现这样的报错信息：the last package successfully received from the rver was 40802382 milliconds ago，截图如下所示。

　　由于我们的系统都是在白天使用，夜里基本上没有用户使用，再加上以上的报错信息都是出现在早晨，结合错误日志初步分析，应该是数据库连接超时自动断开了。百度一番后，得知mysql的默认连接时间是8小时，超过8小时没有操作后就会自动断开连接，但是已经使用了druid数据库连接池，按理说已经对数据库连接做了保护和检查，不应该出现这样的问题。要想彻底弄明白这个问题，就只能去研究druid数据库连接池框架了。

二、druid数据库连接池

　　项目的数据库连接池基本配置信息如下所示

　　通过以上的配置分析得知，一个数据库连接从连接池中借出后经过21600s即6小时后会被强制回收，不会超过mysql的默认8小时，而且也不存在这么长时间的事务，所以不太可能是因为数据库连接借出超时导致上面的错误，那么就是从数据库连接池中申请的连接已经超时了？似乎也不太可能，因为有检查机制，即每隔30s就会检查一次连接池中的连接是否超时，并且连接池中允许存在的空闲连接最大时间为540s。这就奇怪了，到底是什么原因导致上面的错误呢？这时注意到上述错误堆栈中的com.atomikos.datasource.pool.connectionpool.findorwaitforanavailableconnection。是否问题的原因在于使用了atomikos呢，带着这样的疑惑去阅读了druid和atomikos相关的源码。

　　由于atomikos连接池是基于druid连接池之上的，所以atomikos新建和销毁数据库连接都是从druid连接池中借出和归还数据库连接，而不是直接与数据库交互，那么我们就来看看druid是如何维持数据库连接的。

public druidpooledconnection getconnection(long maxwaitmillis) throws sqlexception {　　　　 //初始化检查配置和后台线程        init();        if (filters.size() > 0) {            filterchainimpl filterchain = new filterchainimpl(this);            return filterchain.datasource_connect(this, maxwaitmillis);        } el {            return getconnectiondirect(maxwaitmillis);        }    }

从druid连接池中获取数据库连接，先调用init()方法进行初始化工作，然后调用getconnectiondirect()获取连接。

decrementpoolingcount();druidconnectionholder last = connections[poolingcount];connections[poolingcount] = null;

druidpooledconnection poolalbeconnection = new druidpooledconnection(holder);public druidpooledconnection(druidconnectionholder holder){        super(holder.getconnection());        this.conn = holder.getconnection();        this.holder = holder;        this.lock = holder.lock;        dupclologenable = holder.getdatasource().isdupclologenable();        ownerthread = thread.currentthread();        connectedtimemillis = system.currenttimemillis();}

上述是获取连接池中连接的关键代码，即获取connections数组中的最后一个元素，获取到holder后还需要将其封装为druidpooledconnection，这时该连接的connectedtimemillis会被赋值为当前时间，这个时间在后续的分析中会非常重要。

　　因为配置了testwhileidle为true，所以需要进行下面的有效性检查，获取该连接的上次活跃时间，得到空闲时间，如果超过30s则做有效性检查。

long idlemillis  = currenttimemillis - lastactivetimemillis;long timebetweenevictionrunsmillis = this.timebetweenevictionrunsmillis;if (timebetweenevictionrunsmillis <= 0) {      timebetweenevictionrunsmillis = default_time_between_eviction_runs_millis;}if (idlemillis >= timebetweenevictionrunsmillis        || idlemillis < 0 // unexcepted branch         ) {     boolean validate = testconnectioninternal(poolableconnection.holder, poolableconnection.conn);     if (!validate) {        if (log.isdebugenabled()) {             log.debug("skip not validate connection.");        }        discardconnection(poolableconnection.holder);        continue;        }}

long timemillis = (currrentnanos - pooledconnection.getconnectedtimenano()) / (1000 * 1000);if (timemillis >= removeabandonedtimeoutmillis) {    iter.remove();    pooledconnection.ttraceenable(fal);    abandonedlist.add(pooledconnection);}

同时，由于配置了removeabandoned为true，所以需要检查活跃连接是否超时，如果超时就断开物理连接。下面看一下连接池的回收方法recycle的关键代码

if (phytimeoutmillis > 0) {    long phyconnecttimemillis = currenttimemillis - holder.connecttimemillis;    if (phyconnecttimemillis > phytimeoutmillis) {          discardconnection(holder);          return;    }}lock.lock();try {    if (holder.active) {       生活与科学 activecount--;        holder.active = fal;    }    clocount++;    result = putlast(holder, currenttimemillis);    recyclecount++;} finally {    lock.unlock();}

在对数据库连接进行回收时，如果连接时间超过了数据库的物理连接时间（默认8小时）则需要断开物理连接，否则就调用putlast方法将该连接回收到连接池。

boolean putlast(druidconnectionholder e, long lastactivetimemillis) {        if (poolingcount >= maxactive || e.discard) {            return fal;        }        e.lastactivetimemillis = lastactivetimemillis;        connections[poolingcount] = e;        incrementpoolingcount();        if (poolingcount > poolingpeak) {            poolingpeak = poolingcount;            poolingpeaktime = lastactivetimemillis;        }        notempty.signal();        notemptysignalcount++;        return true;}

注意上述标红的地方，回收的这个连接的lastactivetimemillis被刷新为当前时间，这个时间也是非常重要的，在后续分析中会用到。

三、atomikos框架

　　项目关于atomikos的配置信息，如下所示

从上面的配置可以看出，atomikos连接池的最大连接数是25个，最小连接数是10个，连接最大的存活时间是500s，下面来看一下atomikos的源码。

private void init() throws connectionpoolexception{　　　　     if ( logger.istraceenabled() ) logger.logtrace ( this + ": initializing..." );　　　//如果连接池最小连接数没有达到就新增数据库连接     addconnectionsifminpoolsizenotreached();　　  //开启维持连接池平衡的线程     launchmaintenancetimer();}

以上是atomikos初始化的部分，先补充数据库连接池达到最小连接数，然后开启后台线程维持连接池的平衡。

private void launchmaintenancetimer() {        int maintenanceinterval = properties.getmaintenanceinterval();        if ( maintenanceinterval <= 0 ) {            if ( logger.istraceenabled() ) logger.logtrace ( this + ": using default maintenance interval..." );            maintenanceinterval = default_maintenance_interval;        }        maintenancetimer = new pooledalarmtimer ( maintenanceinterval * 1000 );        maintenancetimer.addalarmtimerlistener(new alarmtimerlistener() {            public void alarm(alarmtimer timer) {                reappool();　　　　　　　　　 //如果达到了最大的存活时间就移除该连接                removeconnectionsthatexceededmaxlifetime();　　　　　　　　　 //如果没有满足最小连接数就新增连接                addconnectionsifminpoolsizenotreached();　　　　　　　　   //移除超过最小连接数以外的连接                removeidleconnectionsifminpoolsizeexceeded();            }        });        taskmanager.singleton.executetask ( maintenancetimer );    }

在配置中，maintenanceinterval的值为30，即每个30秒执行一次上述的四个方法，主要看一下removeconnectionsthatexceededmaxlifetime()这个方法。

private synchronized void removeconnectionsthatexceededmaxlifetime()    {        long maxlifetime = properties.getmaxlifetime();        if ( connections == null || maxlifetime <= 0 ) return;        if ( logger.istraceenabled() ) logger.logtrace ( this + ": closing connections that exceeded maxlifetime" );        iterator<xpooledconnection> it = connections.iterator();        while ( it.hasnext() ) {            xpooledconnection xpc = it.next();            long creationtime = xpc.getcreationtime();            书签制作图片long now = system.currenttimemillis();            if ( xpc.isavailable() &&  ( (now - creationtime) >= (maxlifetime * 1000l) ) ) {                if ( logger.istraceenabled() ) logger.logtrace ( this + ": connection in u for more than " + maxlifetime + "s, destroying it: " + xpc );　　　　　　　　　 //如果超过最大的存活时间就销毁该连接                destroypooledconnection(xpc);                it.remove();            }        }        logcurrentpoolsize();    }

上述方法遍历数据库连接池中的所有连接，如果存活时间超过maxlifetime即500s就销毁该连接，这时由于连接池中的连接数就小于minpoolsize，所以会立即补充新的连接到连接池鞋匠的儿子读后感中。那么，系统在夜间没有用户使用时，atomikos连接池的运行状态为：维持最小的连接数10个数据库连接，当这10个连接超过500s时就会销毁，再重新创建10个新的数据库连接，不断重复这样的操作。

四、分析与总结

　　下面我们开始分析产生错误日志的原因，当没有用户使用系统时，druid连接爱滋病传播途径池应该有10个空闲的连接，atomikos连接池也有10个空闲的连接，这时atomikos的10个连接达到了最大的生存时间500s，就需要销毁这些连接，对于druid来说就是回收连接，调用recycle方法。由于这10个连接应该是500s之前从druid连接池借出的，所以它们的connecttimemillis也是500s之前的时间，即物理连接时间肯定小于8小时，可以成功回收到druid连接池中，同时lastactivetimemillis也更新为当前时间，放在connections数组的末尾。

　　与此同时，atomikos还需要重新生成10个新的连接，即从druid连接池获取10个连接，调用getconnection方法，这时会进行有效性的检查，又因为lastactivetimemillis基本上为当前时间，所以idlemillis肯定比30s小，不需要进行lect 1的连接数据库操作，这样即使该连接已经失效了还是会借出给atomikos。每隔500s不断循环上述操作，并且期间没有用户的操作，一旦超过8个小时的mysql连接时间，atomikos在使用数据库连接时就会产生上述日志中的错误了。

　　综上所述，导致报错的原因其实是使用了两层数据库连接池，这样druid连接池借出的数据库连接并没有被实际使用，这才导致这些数据库连接成功躲避了druid本身的检查机制。

到此这篇关于springboot+atomikos+druid 数据库连接失效分析的文章就介绍到这了,更多相关springboot+atomikos+druid初中语文基础知识手册数据库连接失效分析内容请搜索www.887551.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持www.887551.com！

本文发布于:2023-04-04 22:43:16，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/zuowen/1b9f3c96bf06e2e8e20dedce8c81ceaa.html

本文word下载地址：详解springboot+atomikos+druid 数据库连接失效分析.doc

本文 PDF 下载地址：详解springboot+atomikos+druid 数据库连接失效分析.pdf

上一篇：MyBatis实现批量插入数据,多重forEach循环

下一篇：返回列表