I also modified elevator=deadline but didn't see any change in fencing behavior until increasing <span class="589522904-19032006">O2CB_HEARTBEAT_THRESHOLD </span> to 16 (30 second timeout). <br><br>The issue we were seeing, fencing at precisely 5:15pm every Saturday but we couldn't trace the problem to any specific event or activity occurring at that time. However, we created test a job that was very write intensive to the ocfs2 partition and were then able to crash the nodes at will every time we ran this job. After making the above change to the THRESHOLD neither one of the nodes has fenced/crashed since. It's now been several weeks since making this change.<br><br>Configuration: 2 node RAC cluster, EMC shared storage, Linux x86-64 RH4 update 2, OCFS2, 10.2.0.2 database standard edition.<br><br>Diane Petersen<br>Sr. Oracle DBA<br>ServerCare, Inc.<br><br><b><i>"Weller, Michael" &lt;michael.weller@itz-essen.de&gt;</i></b> wrote:<blockquote class="replbq" style="border-left:
 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px;"> I don't know if I mentioned that to the list, elevator=deadline and rising the THRESHOLD to 14 solved my self-fencing issues.<br><br>(We'll see what happens under a possibly extreme load).<br><br>Michael.<br><br>---<br><br>Dr. Michael Weller<br><br>ITZ Informationstechnologie GmbH<br>Consulting/Systemengineering<br>Bismarckstrasse 57<br>D-45128 Essen<br><br>Phone Office  +49 201 24714 28<br>FAX   Office  +49 201 24714 33<br>Phone Mobile  +49 172 2178078<br>E-Mail        mailto:michael.weller@itz-essen.de<br><br>&gt; -----Urspr�ngliche Nachricht-----<br>&gt; Von: ocfs2-users-bounces@oss.oracle.com [mailto:ocfs2-users-<br>&gt; bounces@oss.oracle.com] Im Auftrag von Zunker, Christian<br>&gt; Gesendet: Dienstag, 18. April 2006 15:21<br>&gt; An: ocfs2-users@oss.oracle.com<br>&gt; Betreff: Re: [Ocfs2-users] heartbeat write timeout<br>&gt; <br>&gt; Hi,<br>&gt; <br>&gt; I experienced the same problems. The
 elevator=deadline parameter didn't<br>&gt; help. But increasing the threshold to 60 did it. I think you could<br>&gt; decrease the threshold, but didn't test it. In another posting, it is said<br>&gt; to take a timeout between 60 and 90 seconds. This would mean a threshold<br>&gt; between 31 and 46.<br>&gt; <br>&gt; I'll test this later.<br>&gt; <br>&gt; Best regards,<br>&gt; Christian<br>&gt; <br>&gt; <br>&gt; -----Urspr�ngliche Nachricht-----<br>&gt; Von: ocfs2-users-bounces@oss.oracle.com [mailto:ocfs2-users-<br>&gt; bounces@oss.oracle.com] Im Auftrag von Weller, Michael<br>&gt; Gesendet: Sonntag, 2. April 2006 14:18<br>&gt; An: Silviu Marin-Caea; ocfs2-users@oss.oracle.com<br>&gt; Betreff: Re: [Ocfs2-users] heartbeat write timeout<br>&gt; <br>&gt; Thx for the hints, I'll try that.<br>&gt; <br>&gt; With regards to the updates, while I generally agree, I can't update the<br>&gt; kernel here, because we'll loose vendor warranty in that case. I know this<br>&gt; is an
 odd concept, but that's how it works. We'll even loose Oracle<br>&gt; support because the kernel update would void HP SAN-support.<br>&gt; <br>&gt; I mentioned SAN Failover, which for example does not work with current<br>&gt; kernel and current (even the not so current HP checked variant) Qlogic<br>&gt; driver.<br>&gt; <br>&gt; Anyway, I'll try your suggestions on monday and drop the list a note if it<br>&gt; worked.<br>&gt; <br>&gt; Thanks,<br>&gt; Michael.<br>&gt; <br>&gt;  ---<br>&gt; <br>&gt; Dr. Michael Weller<br>&gt; <br>&gt; ITZ Informationstechnologie GmbH<br>&gt; Consulting/Systemengineering<br>&gt; Bismarckstrasse 57<br>&gt; D-45128 Essen<br>&gt; <br>&gt; Phone Office    +49 201 24714 28<br>&gt; FAX   Office    +49 201 24714 33<br>&gt; Phone Mobile    +49 172 2178078<br>&gt; E-Mail          mailto:michael.weller@itz-essen.de<br>&gt; &gt; -----Urspr�ngliche Nachricht-----<br>&gt; &gt; Von: ocfs2-users-bounces@oss.oracle.com [mailto:ocfs2-users-<br>&gt; &gt;
 bounces@oss.oracle.com] Im Auftrag von Silviu Marin-Caea<br>&gt; &gt; Gesendet: Sonntag, 2. April 2006 08:26<br>&gt; &gt; An: ocfs2-users@oss.oracle.com<br>&gt; &gt; Betreff: Re: [Ocfs2-users] heartbeat write timeout<br>&gt; &gt;<br>&gt; &gt; On Saturday 01 April 2006 22:36, Weller, Michael wrote:<br>&gt; &gt;<br>&gt; &gt; &gt; we are bound to SLES9SP3 (and EXACTLY that, nothing less, not a patch<br>&gt; &gt; &gt; more)<br>&gt; &gt;<br>&gt; &gt; Having latest updates does not hurt, on the contrary, it helps.  For<br>&gt; &gt; example,<br>&gt; &gt; the latest kernel has OCFS2 1.1.8, while the kernel from SP3 has 1.1.7.<br>&gt; &gt; There are a number of bugfixes.<br>&gt; &gt;<br>&gt; &gt; SLES updates do really have a purpose.  Apply them after testing in a<br>&gt; &gt; non-production system.<br>&gt; &gt;<br>&gt; &gt; &gt; It locks up immediately. Definitely nothing like a 12s timeout<br>&gt; expires.<br>&gt; &gt;<br>&gt; &gt; It just looks like it's immediate, actually,
 the 12s do expire.<br>&gt; &gt;<br>&gt; &gt; &gt; You mention a FAQ regarding some config option which I didn't come<br>&gt; &gt; &gt; across up to now, where can I find it?<br>&gt; &gt;<br>&gt; &gt; /boot/grub/menu.lst<br>&gt; &gt;<br>&gt; &gt; change elevator=cfq to elevator=deadline<br>&gt; &gt;<br>&gt; &gt; http://oss.oracle.com/projects/ocfs2/<br>&gt; &gt; scroll down, look at the red text<br>&gt; &gt;<br>&gt; &gt; &gt; Which options would you recommend to fix the problem or at least make<br>&gt; &gt; &gt; locks much less likely.<br>&gt; &gt;<br>&gt; &gt; You could also increase the timeout:<br>&gt; &gt;<br>&gt; &gt; /etc/sysconfig/o2cb<br>&gt; &gt;<br>&gt; &gt; # O2CB_HEARTBEAT_THRESHOLD: Iterations before a node is considered dead.<br>&gt; &gt; O2CB_HEARTBEAT_THRESHOLD=16<br>&gt; &gt;<br>&gt; &gt;<br>&gt; &gt; _______________________________________________<br>&gt; &gt; Ocfs2-users mailing list<br>&gt; &gt; Ocfs2-users@oss.oracle.com<br>&gt; &gt;
 http://oss.oracle.com/mailman/listinfo/ocfs2-users<br>&gt; <br>&gt; <br>&gt; <br>&gt; _______________________________________________<br>&gt; Ocfs2-users mailing list<br>&gt; Ocfs2-users@oss.oracle.com<br>&gt; http://oss.oracle.com/mailman/listinfo/ocfs2-users<br><br>BEGIN:VCARD<br>VERSION:2.1<br>N:Weller;Michael;;Dr.<br>FN:Michael Weller<br>ORG:ITZ Informationstechnologie GmbH;System Engineering. Internet Security, VPN, IP-Routing, Switching, Unix, Linux<br>TITLE:Senior Consultant<br>NOTE;ENCODING=QUOTED-PRINTABLE:=0D=0A<br>TEL;WORK;VOICE:+49 2012471428<br>TEL;CELL;VOICE:+49 1722178078<br>TEL;WORK;FAX:+49 201 2471433<br>ADR;WORK:;;Bismarckstra�e 57;Essen;;45128;Deutschland<br>LABEL;WORK;ENCODING=QUOTED-PRINTABLE:Bismarckstra=DFe 57=0D=0AEssen 45128=0D=0ADeutschland<br>EMAIL;PREF;INTERNET:michael.weller@itz-essen.de<br>REV:20050221T135645Z<br>END:VCARD<br>_______________________________________________<br>Ocfs2-users mailing
 list<br>Ocfs2-users@oss.oracle.com<br>http://oss.oracle.com/mailman/listinfo/ocfs2-users<br></blockquote><br><p>
                <hr size=1>Yahoo! Messenger with Voice. <a href="http://us.rd.yahoo.com/mail_us/taglines/postman1/*http://us.rd.yahoo.com/evt=39663/*http://voice.yahoo.com">Make PC-to-Phone Calls</a> to the US (and 30+ countries) for 2¢/min or less.