<div><div>Hi, all:</div><div>I am using rds 4.1 integratd by MLNX_OFED(MLNX_OFED_LINUX-2.3-2.0.0 &nbsp;on CentOS6.5 x64).&nbsp;</div><div>If I increase the message buffer length on the client via sendmsg (maybe 10000 bytes), then the server will be blocking on revemsg(3,&nbsp;</div><div>and then rds-ping will not output and rds-stress will output all zero traffics.</div><div>After restarting the following service:</div><div># /etc/init.d/openibd restart</div><div>The kernel reports the following errors:</div><div>Oct 29 15:13:31 dbnode01 kernel: RDS/IB: connection &lt;172.16.10.102,172.16.10.99,0&gt; dropped</div><div>Oct 29 15:13:45 dbnode01 kernel: RDS/IB: connection &lt;172.16.10.102,172.16.10.104,0&gt; dropped</div><div>Oct 29 15:13:45 dbnode01 kernel: RDS/IB: connection &lt;172.16.10.102,172.16.10.103,0&gt; dropped</div><div>Oct 29 15:14:15 dbnode01 kernel: RDS/IB: device cleanup timed out after &nbsp;30 secs (refcount=3)</div><div><br></div><div>Oct 29 15:16:51 dbnode01 kernel: INFO: task krdsd:2129 blocked for more than 120 seconds.</div><div>Oct 29 15:16:51 dbnode01 kernel: &nbsp; &nbsp; &nbsp;Tainted: P &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; --------------- &nbsp; &nbsp;2.6.32-431.el6.x86_64 #1</div><div>Oct 29 15:16:51 dbnode01 kernel: "echo 0 &gt; /proc/sys/kernel/hung_task_timeout_secs" disables this message.</div><div>Oct 29 15:16:51 dbnode01 kernel: krdsd &nbsp; &nbsp; &nbsp; &nbsp; D 0000000000000001 &nbsp; &nbsp; 0 &nbsp;2129 &nbsp; &nbsp; &nbsp;2 0x00000000</div><div>Oct 29 15:16:51 dbnode01 kernel: ffff880438b8dd20 0000000000000046 0000000000000000 ffff88082579c400</div><div>Oct 29 15:16:51 dbnode01 kernel: 0000000000000000 ffff88082579c470 0000000000000207 0000000000000207</div><div>Oct 29 15:16:51 dbnode01 kernel: ffff8804384abaf8 ffff880438b8dfd8 000000000000fbc8 ffff8804384abaf8</div><div>Oct 29 15:16:51 dbnode01 kernel: Call Trace:</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0c5058d&gt;] rds_ib_conn_shutdown+0x9d/0x5d0 [rds_rdma]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8109b2a0&gt;] ? autoremove_wake_function+0x0/0x40</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0c2db30&gt;] ? rds_shutdown_worker+0x0/0x20 [rds]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0c28cd6&gt;] rds_conn_shutdown+0x156/0x200 [rds]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0c2db30&gt;] ? rds_shutdown_worker+0x0/0x20 [rds]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0c2db45&gt;] rds_shutdown_worker+0x15/0x20 [rds]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff81094d20&gt;] worker_thread+0x170/0x2a0</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8109b2a0&gt;] ? autoremove_wake_function+0x0/0x40</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff81094bb0&gt;] ? worker_thread+0x0/0x2a0</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8109aef6&gt;] kthread+0x96/0xa0</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8100c20a&gt;] child_rip+0xa/0x20</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8109ae60&gt;] ? kthread+0x0/0xa0</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8100c200&gt;] ? child_rip+0x0/0x20</div><div>Oct 29 15:16:51 dbnode01 kernel: INFO: task modprobe:7170 blocked for more than 120 seconds.</div><div>Oct 29 15:16:51 dbnode01 kernel: &nbsp; &nbsp; &nbsp;Tainted: P &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; --------------- &nbsp; &nbsp;2.6.32-431.el6.x86_64 #1</div><div>Oct 29 15:16:51 dbnode01 kernel: "echo 0 &gt; /proc/sys/kernel/hung_task_timeout_secs" disables this message.</div><div>Oct 29 15:16:51 dbnode01 kernel: modprobe &nbsp; &nbsp; &nbsp;D 0000000000000001 &nbsp; &nbsp; 0 &nbsp;7170 &nbsp; 7110 0x00000080</div><div>Oct 29 15:16:51 dbnode01 kernel: ffff880438f5bbf8 0000000000000082 0000000000000000 0000000000000082</div><div>Oct 29 15:16:51 dbnode01 kernel: ffff880438f5bbc8 ffffffff81065c5e ffff880438f5bb88 ffff880400000003</div><div>Oct 29 15:16:51 dbnode01 kernel: ffff880437e83af8 ffff880438f5bfd8 000000000000fbc8 ffff880437e83af8</div><div>Oct 29 15:16:51 dbnode01 kernel: Call Trace:</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff81065c5e&gt;] ? try_to_wake_up+0x24e/0x3e0</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff815287b5&gt;] schedule_timeout+0x215/0x2e0</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff81058d53&gt;] ? __wake_up+0x53/0x70</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff81528433&gt;] wait_for_common+0x123/0x180</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff81065df0&gt;] ? default_wake_function+0x0/0x20</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff810955b2&gt;] ? queue_work_on+0x42/0x60</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8152854d&gt;] wait_for_completion+0x1d/0x20</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0a5b0be&gt;] cma_remove_one+0x18e/0x210 [rdma_cm]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0b3d60f&gt;] ib_unregister_device+0x4f/0x100 [ib_core]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0b75b06&gt;] mlx4_ib_remove+0xc6/0x300 [mlx4_ib]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0a849e1&gt;] mlx4_remove_device+0x71/0x90 [mlx4_core]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0a84b13&gt;] mlx4_unregister_interface+0x43/0x80 [mlx4_core]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffffa0b8dac1&gt;] __exit_compat+0x15/0x69 [mlx4_ib]</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff810b9454&gt;] sys_delete_module+0x194/0x260</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff810e2067&gt;] ? audit_syscall_entry+0x1d7/0x200</div><div>Oct 29 15:16:51 dbnode01 kernel: [&lt;ffffffff8100b072&gt;] system_call_fastpath+0x16/0x1b</div><div style="color: rgb(0, 0, 0); font-family: arial; font-size: 14px;"><br></div><div style="color: rgb(0, 0, 0); font-family: arial; font-size: 14px;"><br></div><div style="color: rgb(0, 0, 0); font-family: arial; font-size: 14px;"><br></div><div style="color: rgb(0, 0, 0); font-family: arial; font-size: 14px;"><br></div></div><!-- jy5ContentSuffix --><br><br><span title="neteasefooter"><p>&nbsp;</p></span>