<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:p="urn:schemas-microsoft-com:office:powerpoint" xmlns:a="urn:schemas-microsoft-com:office:access" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:s="uuid:BDC6E3F0-6DA3-11d1-A2A3-00AA00C14882" xmlns:rs="urn:schemas-microsoft-com:rowset" xmlns:z="#RowsetSchema" xmlns:b="urn:schemas-microsoft-com:office:publisher" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:odc="urn:schemas-microsoft-com:office:odc" xmlns:oa="urn:schemas-microsoft-com:office:activation" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:q="http://schemas.xmlsoap.org/soap/envelope/" xmlns:rtc="http://microsoft.com/officenet/conferencing" xmlns:D="DAV:" xmlns:Repl="http://schemas.microsoft.com/repl/" xmlns:mt="http://schemas.microsoft.com/sharepoint/soap/meetings/" xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" xmlns:ppda="http://www.passport.com/NameSpace.xsd" xmlns:ois="http://schemas.microsoft.com/sharepoint/soap/ois/" xmlns:dir="http://schemas.microsoft.com/sharepoint/soap/directory/" xmlns:ds="http://www.w3.org/2000/09/xmldsig#" xmlns:dsp="http://schemas.microsoft.com/sharepoint/dsp" xmlns:udc="http://schemas.microsoft.com/data/udc" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:sub="http://schemas.microsoft.com/sharepoint/soap/2002/1/alerts/" xmlns:ec="http://www.w3.org/2001/04/xmlenc#" xmlns:sp="http://schemas.microsoft.com/sharepoint/" xmlns:sps="http://schemas.microsoft.com/sharepoint/soap/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:udcs="http://schemas.microsoft.com/data/udc/soap" xmlns:udcxf="http://schemas.microsoft.com/data/udc/xmlfile" xmlns:udcp2p="http://schemas.microsoft.com/data/udc/parttopart" xmlns:wf="http://schemas.microsoft.com/sharepoint/soap/workflow/" xmlns:dsss="http://schemas.microsoft.com/office/2006/digsig-setup" xmlns:dssi="http://schemas.microsoft.com/office/2006/digsig" xmlns:mdssi="http://schemas.openxmlformats.org/package/2006/digital-signature" xmlns:mver="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns:mrels="http://schemas.openxmlformats.org/package/2006/relationships" xmlns:spwp="http://microsoft.com/sharepoint/webpartpages" xmlns:ex12t="http://schemas.microsoft.com/exchange/services/2006/types" xmlns:ex12m="http://schemas.microsoft.com/exchange/services/2006/messages" xmlns:pptsl="http://schemas.microsoft.com/sharepoint/soap/SlideLibrary/" xmlns:spsl="http://microsoft.com/webservices/SharePointPortalServer/PublishedLinksService" xmlns:Z="urn:schemas-microsoft-com:" xmlns:st="&#1;" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<!--[if !mso]>
<style>
v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style>
<![endif]-->
<title>2 node OCFS2 clusters</title>
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";
        color:black;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";
        color:black;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";
        color:black;}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;
        color:black;}
span.EmailStyle20
        {mso-style-type:personal;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
span.EmailStyle21
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body bgcolor=white lang=EN-GB link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Hi,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I have done some more tests today, and I observed the following:<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Test 1:<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 0 - ifdown eth2<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 0 - OCFS2 filesystem stalls on both nodes<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 1 - Decides to reboot<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 0 - Resumes OCFS2 service (while still off the network) OCFS2
filesystem back online<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 1 - Cannot re-join cluster as node 0 is off the network and
has the fs lock (Transport endpoint error)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 0 - ifup eth2<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 1 - Re-joins the clusters and re-mounts OCFS2 filesystem.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Test 2:<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 1 - ifdown eth2<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 0 - OCFS2 filesystem stalls on both nodes<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 1 &nbsp;- Decides to reboot<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 0 - Resumes OCFS2 service, OCFS2 filesystem back online<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>node 1 &#8211; Boots up, re-joins cluster and re-mounts OCFS2
filesystem.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Is this the expected behaviour? And if it is, is there anything
we can do avoid the loss of the OCFS2 filesystems?<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Here&#8217;s the messages file outputs.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Test 1 - Node 0<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:00:26 my_node0 kernel: ocfs2: Unmounting device
(253,9) on (node 0)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:21 my_node0 modprobe: FATAL: Module ocfs2_stackglue
not found.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:21 my_node0 kernel: OCFS2 Node Manager 1.4.4 Tue
Sep&nbsp; 8 11:56:46 PDT 2009 (build 18a3a72794aaca6c0334f456bca873cd)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:21 my_node0 kernel: OCFS2 DLM 1.4.4 Tue Sep&nbsp; 8
11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:21 my_node0 kernel: OCFS2 DLMFS 1.4.4 Tue Sep&nbsp;
8 11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:21 my_node0 kernel: OCFS2 User DLM kernel interface
loaded<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:46 my_node0 kernel: OCFS2 1.4.4 Tue Sep&nbsp; 8
11:56:43 PDT 2009 (build 3a5bffa75b910d5bcdd5c607c4394b1e)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:46 my_node0 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:46 my_node0 kernel: ocfs2: Mounting device (253,9)
on (node 0, slot 0) with ordered data mode.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:59 my_node0 kernel: ocfs2_dlm: Node 1 joins domain
21751145F96E45649324C9EEF5485248<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:59 my_node0 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:07:51 my_node0 kernel:
(15,1):dlm_do_master_request:1334 ERROR: link to 1 went down!<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:07:51 my_node0 kernel:
(15,1):dlm_get_lock_resource:917 ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:34 my_node0 kernel:
(22108,1):ocfs2_dlm_eviction_cb:98 device (253,9): dlm has evicted node 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:34 my_node0 kernel:
(29443,1):dlm_get_lock_resource:844
21751145F96E45649324C9EEF5485248:M000000000000000000001f96e7b609: at least one
node (1) to recover before lock mastery can begin<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:35 my_node0 kernel:
(29443,1):dlm_get_lock_resource:898
21751145F96E45649324C9EEF5485248:M000000000000000000001f96e7b609: at least one
node (1) to recover before lock mastery can begin<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:36 my_node0 kernel:
(15,1):dlm_restart_lock_mastery:1223 ERROR: node down! 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:36 my_node0 kernel:
(15,1):dlm_wait_for_lock_mastery:1040 ERROR: status = -11<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:36 my_node0 kernel:
(22167,0):dlm_get_lock_resource:844 21751145F96E45649324C9EEF5485248:$RECOVERY:
at least one node (1) to recover before lock mastery can begin<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:36 my_node0 kernel:
(22167,0):dlm_get_lock_resource:878 21751145F96E45649324C9EEF5485248: recovery
map is not empty, but must master $RECOVERY lock now<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:36 my_node0 kernel: (22167,0):dlm_do_recovery:524
(22167) Node 0 is the Recovery Master for the Dead Node 1 for Domain
21751145F96E45649324C9EEF5485248<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:09:46 my_node0 kernel:
(29443,1):ocfs2_replay_journal:1183 Recovering node 1 from slot 1 on device
(253,9)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:27 my_node0 kernel: ocfs2_dlm: Node 1 joins domain
21751145F96E45649324C9EEF5485248<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:27 my_node0 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Test 1 &#8211; Node 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:00:26 my_node1 kernel: ocfs2_dlm: Node 0 leaves domain
21751145F96E45649324C9EEF5485248<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:00:26 my_node1 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:00:46 my_node1 kernel: ocfs2: Unmounting device
(253,9) on (node 1)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:30 my_node1 modprobe: FATAL: Module ocfs2_stackglue
not found.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:30 my_node1 kernel: OCFS2 Node Manager 1.4.4 Tue
Sep&nbsp; 8 11:56:46 PDT 2009 (build 18a3a72794aaca6c0334f456bca873cd)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:30 my_node1 kernel: OCFS2 DLM 1.4.4 Tue Sep&nbsp; 8
11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:30 my_node1 kernel: OCFS2 DLMFS 1.4.4 Tue Sep&nbsp;
8 11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:30 my_node1 kernel: OCFS2 User DLM kernel interface
loaded<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:59 my_node1 kernel: OCFS2 1.4.4 Tue Sep&nbsp; 8
11:56:43 PDT 2009 (build 3a5bffa75b910d5bcdd5c607c4394b1e)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:59 my_node1 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:02:59 my_node1 kernel: ocfs2: Mounting device (253,9)
on (node 1, slot 1) with ordered data mode.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:07:27 my_node1 kernel:
(7351,3):dlm_send_remote_convert_request:395 ERROR: status = -112<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:07:27 my_node1 kernel:
(7351,3):dlm_wait_for_node_death:370 21751145F96E45649324C9EEF5485248: waiting
5000ms for notification of death of node 0<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:07:57 my_node1 kernel: (7351,3):dlm_send_remote_convert_request:395
ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:07:57 my_node1 kernel:
(7351,3):dlm_wait_for_node_death:370 21751145F96E45649324C9EEF5485248: waiting
5000ms for notification of death of node 0<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:08:27 my_node1 kernel: (15,1):dlm_do_master_request:1334
ERROR: link to 0 went down!<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:08:27 my_node1 kernel:
(7351,3):dlm_send_remote_convert_request:395 ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:08:27 my_node1 kernel:
(7351,3):dlm_wait_for_node_death:370 21751145F96E45649324C9EEF5485248: waiting
5000ms for notification of death of node 0<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:08:27 my_node1 kernel:
(15,1):dlm_get_lock_resource:917 ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:11:31 my_node1 modprobe: FATAL: Module ocfs2_stackglue
not found.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:11:32 my_node1 kernel: OCFS2 Node Manager 1.4.4 Tue
Sep&nbsp; 8 11:56:46 PDT 2009 (build 18a3a72794aaca6c0334f456bca873cd)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:11:32 my_node1 kernel: OCFS2 DLM 1.4.4 Tue Sep&nbsp; 8
11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:11:32 my_node1 kernel: OCFS2 DLMFS 1.4.4 Tue Sep&nbsp;
8 11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:11:32 my_node1 kernel: OCFS2 User DLM kernel interface
loaded<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:11:40 my_node1 kernel: OCFS2 1.4.4 Tue Sep&nbsp; 8
11:56:43 PDT 2009 (build 3a5bffa75b910d5bcdd5c607c4394b1e)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel: (6282,0):dlm_request_join:1036
ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel: (6282,0):dlm_try_to_join_domain:1210
ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel: (6282,0):dlm_join_domain:1488
ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel:
(6282,0):dlm_register_domain:1754 ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel: (6282,0):ocfs2_dlm_init:2723
ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel:
(6282,0):ocfs2_mount_volume:1437 ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:06 my_node1 kernel: ocfs2: Unmounting device
(253,9) on (node 1)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:27 my_node1 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:12:27 my_node1 kernel: ocfs2: Mounting device (253,9)
on (node 1, slot 1) with ordered data mode.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Test 2 &#8211; Node 0<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:16:37 my_node0 kernel:
(22166,3):dlm_send_proxy_ast_msg:458 ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:16:37 my_node0 kernel: (22166,3):dlm_flush_asts:600
ERROR: status = -107<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:17:35 my_node0 kernel:
(22108,1):ocfs2_dlm_eviction_cb:98 device (253,9): dlm has evicted node 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:17:35 my_node0 kernel:
(6515,1):ocfs2_replay_journal:1183 Recovering node 1 from slot 1 on device
(253,9)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:17:36 my_node0 kernel:
(22167,0):dlm_get_lock_resource:844 21751145F96E45649324C9EEF5485248:$RECOVERY:
at least one node (1) to recover before lock mastery can begin<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:17:36 my_node0 kernel:
(22167,0):dlm_get_lock_resource:878 21751145F96E45649324C9EEF5485248: recovery
map is not empty, but must master $RECOVERY lock now<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:17:36 my_node0 kernel: (22167,0):dlm_do_recovery:524
(22167) Node 0 is the Recovery Master for the Dead Node 1 for Domain
21751145F96E45649324C9EEF5485248<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:31 my_node0 kernel: ocfs2_dlm: Node 1 joins domain
21751145F96E45649324C9EEF5485248<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:31 my_node0 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Test2 &#8211; Node 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:22 my_node1 modprobe: FATAL: Module ocfs2_stackglue
not found.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:23 my_node1 kernel: OCFS2 Node Manager 1.4.4 Tue
Sep&nbsp; 8 11:56:46 PDT 2009 (build 18a3a72794aaca6c0334f456bca873cd)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:23 my_node1 kernel: OCFS2 DLM 1.4.4 Tue Sep&nbsp; 8
11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:23 my_node1 kernel: OCFS2 DLMFS 1.4.4 Tue Sep&nbsp;
8 11:56:46 PDT 2009 (build e6e41b84c785deeea891e5873dbf19ab)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:23 my_node1 kernel: OCFS2 User DLM kernel interface
loaded<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:31 my_node1 kernel: OCFS2 1.4.4 Tue Sep&nbsp; 8
11:56:43 PDT 2009 (build 3a5bffa75b910d5bcdd5c607c4394b1e)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:31 my_node1 kernel: ocfs2_dlm: Nodes in domain
(&quot;21751145F96E45649324C9EEF5485248&quot;): 0 1<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Nov 17 11:19:31 my_node1 kernel: ocfs2: Mounting device (253,8)
on (node 1, slot 1) with ordered data mode.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Regards,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Mark<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p>&nbsp;</o:p></span></p>

<div>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'>

<p class=MsoNormal><b><span lang=EN-US style='font-size:10.0pt;font-family:
"Tahoma","sans-serif";color:windowtext'>From:</span></b><span lang=EN-US
style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'>
Srinivas Eeda [mailto:srinivas.eeda@oracle.com] <br>
<b>Sent:</b> 16 November 2009 16:05<br>
<b>To:</b> Thompson, Mark<br>
<b>Cc:</b> ocfs2-users@oss.oracle.com<br>
<b>Subject:</b> Re: [Ocfs2-users] 2 node OCFS2 clusters<o:p></o:p></span></p>

</div>

</div>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal>Thompson, Mark wrote: <o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Hi Srini,</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Thanks for the response.</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>So are the following statements correct:</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>If I stop the networking on node 1, node 0 will continue to
allow OCFS2 filesystems to work and not reboot itself. </span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>If I stop the networking on node 0, node 1 (now being the lowest
node?) will continue to allow OCFS2 filesystems to work and not reboot itself.</span><o:p></o:p></p>

<p class=MsoNormal>In both the cases node 0 will survive, because that's the
node that has lowest node number (defined in cluster.conf). This applies to the
scenario where interconnect went down but nodes are healthy and are heartbeating
to the disk.<br>
<br>
<o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I guess I just need to know if it&#8217;s possible to have a 2
node OCFS2 cluster that will cope with either one of the nodes dying, and have
the remaining node still provide service.</span><o:p></o:p></p>

<p class=MsoNormal>If node 0 itself panics, reboots then node 1 will survive.<br>
<br>
<o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Regards,</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Mark </span><o:p></o:p></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>&nbsp;</span><o:p></o:p></p>

<div>

<div style='border:none;border-top:solid windowtext 1.0pt;padding:3.0pt 0cm 0cm 0cm;
border-color:-moz-use-text-color -moz-use-text-color'>

<p class=MsoNormal><b><span lang=EN-US style='font-size:10.0pt;font-family:
"Tahoma","sans-serif";color:windowtext'>From:</span></b><span lang=EN-US
style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'>
Srinivas Eeda [<a href="mailto:srinivas.eeda@oracle.com">mailto:srinivas.eeda@oracle.com</a>]
<br>
<b>Sent:</b> 16 November 2009 14:57<br>
<b>To:</b> Thompson, Mark<br>
<b>Cc:</b> <a href="mailto:ocfs2-users@oss.oracle.com">ocfs2-users@oss.oracle.com</a><br>
<b>Subject:</b> Re: [Ocfs2-users] 2 node OCFS2 clusters</span><o:p></o:p></p>

</div>

</div>

<p class=MsoNormal>&nbsp;<o:p></o:p></p>

<p class=MsoNormal>In a cluster with more than 2 nodes, if a network on one
node goes down, that node will evict itself but other nodes will survive. But
in a two node cluster, the node with lowest node number will survive no mater
on which node network went down.<br>
<br>
thanks,<br>
--Srini<br>
<br>
Thompson, Mark wrote: <o:p></o:p></p>

<p><span style='font-family:"Calibri","sans-serif"'>Hi,</span><o:p></o:p></p>

<p><span style='font-family:"Calibri","sans-serif"'>This is my first post here
so</span> <span style='font-family:"Calibri","sans-serif"'>please be gentle
with me.</span><o:p></o:p></p>

<p><span style='font-family:"Calibri","sans-serif"'>My question is, can you have
a 2 node OCFS2 cluster, disconnect one node from the network, and have the
remaining node continue to function normally? Currently we have a 2 node
cluster and if we stop the NIC that has the OCFS2 o2cb net connection running
on it, the</span> <span style='font-family:"Calibri","sans-serif"'>other node
will reboot itself.</span> <span style='font-family:"Calibri","sans-serif"'>I
have researched having a 2 node OCFS2 cluster but so far I have been unable to
find a clear solution. I have looked at the FAQ regarding quorum,</span> <span
style='font-family:"Calibri","sans-serif"'>and my OCFS2 init scripts are
enabled etc.</span><o:p></o:p></p>

<p><span style='font-family:"Calibri","sans-serif"'>Is this possible, or should
we look at alternative solutions?</span><o:p></o:p></p>

<p><span style='font-family:"Calibri","sans-serif"'>Regards,</span><o:p></o:p></p>

<p><span style='font-family:"Calibri","sans-serif"'>Mark</span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>This e-mail
has come from Experian, the only business to have been twice named the UK's
'Business of the Year&#8217; </span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>&nbsp;</span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>===================================================================================</span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Information
in this e-mail and any attachments is confidential, and may not be copied or
used by anyone other than the addressee, nor disclosed to any third party
without our permission. There is no intention to create any legally binding
contract or other binding commitment through the use of this electronic
communication unless it is issued in accordance with the Experian Limited
standard terms and conditions of purchase or other express written agreement
between Experian Limited and the recipient. </span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Although Experian
has taken reasonable steps to ensure that this communication and any
attachments are free from computer virus, you are advised to take your own
steps to ensure that they are actually virus free. </span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Companies Act
information:</span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Registered
name: Experian Limited </span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Registered
office: Landmark House, Experian Way, NG2 Business Park, Nottingham, NG80 1ZZ,
United Kingdom</span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Place of
registration: England and Wales </span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>Registered
number: 653331</span><o:p></o:p></p>

<p><span style='font-size:8.0pt;font-family:"Arial","sans-serif"'>&nbsp;</span><o:p></o:p></p>

<pre>&nbsp;<o:p></o:p></pre><pre style='text-align:center'><o:p>&nbsp;</o:p></pre><pre
style='text-align:center'>

<hr size=4 width="90%" align=center>

</pre><pre style='text-align:center'><o:p>&nbsp;</o:p></pre><pre
style='text-align:center'><o:p>&nbsp;</o:p></pre><pre style='text-align:center'>&nbsp; <o:p></o:p></pre><pre>&nbsp;<o:p></o:p></pre><pre>_______________________________________________<o:p></o:p></pre><pre>Ocfs2-users mailing list<o:p></o:p></pre><pre><a
href="mailto:Ocfs2-users@oss.oracle.com">Ocfs2-users@oss.oracle.com</a><o:p></o:p></pre><pre><a
href="http://oss.oracle.com/mailman/listinfo/ocfs2-users">http://oss.oracle.com/mailman/listinfo/ocfs2-users</a><o:p></o:p></pre></div>

</body>

</html>