<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#ffffff" text="#000000">
    This is from one of the surviving node. As to why a node died will<br>
    be known by looking at the netconsole logs of the dead node.<br>
    <br>
    On 03/04/2011 02:01 PM, Garcia, Raymundo wrote:
    <blockquote
cite="mid:9987FA2A6C2D3942B5BA1BD10FBA392C0141D5553C07@NLCLUEXM05.connect1.local"
      type="cite">
      <meta http-equiv="Content-Type" content="text/html;
        charset=ISO-8859-1">
      <meta name="Generator" content="Microsoft Word 12 (filtered
        medium)">
      <style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
</style><!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
      <div class="Section1">
        <p class="MsoNormal">Hello&#8230; I wonder if someone have had similar
          problem like this&#8230; a node evicts almost in a weekly basis and
          I have not found the root cause yet&#8230;.
          <o:p></o:p></p>
        <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
        <p class="MsoNormal">Mar 2 10:20:57 xirisoas3 kernel: ocfs2_dlm:
          Node 1 joins domain 129859624F7042EAB9829B18CA65FC88<o:p></o:p></p>
        <p class="MsoNormal">Mar 2 10:20:57 xirisoas3 kernel: ocfs2_dlm:
          Nodes in domain ("129859624F7042EAB9829B18CA65FC88"): 1 2 3 4<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:18:02 xirisoas3 kernel: o2net: no
          longer connected to node XIRISOAS2 (num 2) at 10.0.0.5:9999<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:18:04 xirisoas3 kernel:
          (23344,2):dlm_get_lock_<a class="moz-txt-link-freetext" href="resource:921">resource:921</a>
          129859624F7042EAB9829B18CA65FC88:$RECOVERY: at least one node
          (2) torecover before lock mastery can begin<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:18:04 xirisoas3 kernel:
          (23344,2):dlm_get_lock_<a class="moz-txt-link-freetext" href="resource:955">resource:955</a>
          129859624F7042EAB9829B18CA65FC88: recovery map is not empty,
          but must master $RECOVERY lock now<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:18:04 xirisoas3 kernel:
          (23344,2):dlm_do_recovery:519 (23344) Node 3 is the Recovery
          Master for the Dead Node 2 for Domain
          129859624F7042EAB9829B18CA65FC88<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:20:48 xirisoas3 kernel:
          (22790,2):o2net_connect_expired:1585 ERROR: no connection
          established with node 2 after 10.0 seconds, giving up and
          returning errors.<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:20:59 xirisoas3 kernel: o2net:
          connected to node XIRISOAS2 (num 2) at 10.0.0.5:9999<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:20:59 xirisoas3 kernel: ocfs2_dlm:
          Node 2 joins domain 129859624F7042EAB9829B18CA65FC88<o:p></o:p></p>
        <p class="MsoNormal">Mar 3 16:20:59 xirisoas3 kernel: ocfs2_dlm:
          Nodes in domain ("129859624F7042EAB9829B18CA65FC88"): 1 2 3 4<o:p></o:p></p>
        <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
        <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
        <p class="MsoNormal">Maybe someone has some light in this
          problem&#8230; I appreciate any help.<o:p></o:p></p>
        <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
        <p class="MsoNormal">Thanks<o:p></o:p></p>
        <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
        <p class="MsoNormal"><span style="color: rgb(36, 64, 97);">Raymundo
            Garcia<o:p></o:p></span></p>
        <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
      </div>
      <br>
      <hr>
      <font size="1" color="Gray" face="Arial">The information contained
        in this message may be confidential and legally protected under
        applicable law. The message is intended solely for the
        addressee(s). If you are not the intended recipient, you are
        hereby notified that any use, forwarding, dissemination, or
        reproduction of this message is strictly prohibited and may be
        unlawful. If you are not the intended recipient, please contact
        the sender by return e-mail and destroy all copies of the
        original message.<br>
      </font>
      <pre wrap="">
<fieldset class="mimeAttachmentHeader"></fieldset>
_______________________________________________
Ocfs2-users mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Ocfs2-users@oss.oracle.com">Ocfs2-users@oss.oracle.com</a>
<a class="moz-txt-link-freetext" href="http://oss.oracle.com/mailman/listinfo/ocfs2-users">http://oss.oracle.com/mailman/listinfo/ocfs2-users</a></pre>
    </blockquote>
    <br>
  </body>
</html>