<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Arial","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Arial","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=VI link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span lang=EN-US>Hi all,<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>I am using OCFS2-1.4.7 for 2 servers which
is running Red hat enterprise 5.7 kernel 2.6.18-274.el5.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>OCFS2 I use for drdb for replicating
master-master. My 2 servers was installed HA-Proxy.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Yesterday, server web1 was down with the
log kernel panic. And today, web2 was down too. After that, I trace the log
file on these server and found that the reason from ocfs2.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>The log like this:<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: PingAck did not arrive in time.<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: peer( Primary -&gt; Unknown ) conn( Connected
-&gt; NetworkFailure ) pdsk( UpToDate -&gt; DUnknown ) <o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: asender terminated<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: Terminating asender thread<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: error receiving Data, e: -5 l: 4096!<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: block drbd0: new current UUID
A69EE0FA8CB9B85D:C9BABEF0844508EB:2F0151CEDDA9713A:2F0051CEDDA9713B<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: Connection closed<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: conn( NetworkFailure -&gt; Unconnected ) <o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: receiver terminated<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: Restarting receiver thread<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: receiver (re)started<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:37 web1 kernel: d-con r0: conn( Unconnected -&gt; WFConnection ) <o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: Handshake successful: Agreed network protocol
version 100<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: Peer authenticated using 20 bytes HMAC<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: conn( WFConnection -&gt; WFReportParams ) <o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: Starting asender thread (from drbd_r_r0 [1164])<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: drbd_sync_handshake:<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: self
A69EE0FA8CB9B85D:C9BABEF0844508EB:2F0151CEDDA9713A:2F0051CEDDA9713B bits:466
flags:0<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: peer
3ED53D15A1945AAF:C9BABEF0844508EB:2F0151CEDDA9713B:2F0051CEDDA9713B bits:49
flags:0<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: uuid_compare()=100 by rule 90<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: helper command: /sbin/drbdadm
initial-split-brain minor-0<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: helper command: /sbin/drbdadm initial-split-brain
minor-0 exit code 0 (0x0)<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: Split-Brain detected but unresolved,
dropping connection!<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: helper command: /sbin/drbdadm split-brain
minor-0<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: block drbd0: helper command: /sbin/drbdadm split-brain
minor-0 exit code 0 (0x0)<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: conn( WFReportParams -&gt; Disconnecting ) <o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: error receiving ReportState, e: -5 l: 0!<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: asender terminated<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: Terminating asender thread<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: Connection closed<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: conn( Disconnecting -&gt; StandAlone ) <o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: receiver terminated<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:53 web1 kernel: d-con r0: Terminating receiver thread<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:54 web1 kernel: (httpd,11395,3):ocfs2_truncate_file:425 ERROR: bug
expression: le64_to_cpu(fe-&gt;i_size) != i_size_read(inode)<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:54 web1 kernel: (httpd,11395,3):ocfs2_truncate_file:425 ERROR: Inode
389752, inode i_size = 28059 != di i_size = 17004, i_flags = 0x1<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3
10:58:54 web1 kernel: ----------- [cut here ] --------- [please bite here ]
---------<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US>Jul&nbsp; 3 10:58:54
web1 kernel: Kernel BUG at
...rpmbuild/xiaowei/BUILD/ocfs2-1.4.7/fs/ocfs2/file.c:425<o:p></o:p></span></i></p>

<p class=MsoNormal style='margin-left:36.0pt'><i><span lang=EN-US><o:p>&nbsp;</o:p></span></i></p>

<p class=MsoNormal><span lang=EN-US>Is there anyone meet the same situation? Please
help me<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Thanks and Regards,<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Namldp<o:p></o:p></span></p>

</div>

</body>

</html>