<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=US-ASCII">


<META content="MSHTML 6.00.2900.5512" name=GENERATOR></HEAD>
<BODY>
<DIV dir=ltr align=left><FONT face=Arial color=#0000ff size=2><SPAN 
class=064531914-10102008>Thanks Tao, Luis... Soony I'll change the Debian node 
so I'll be happy again.</SPAN></FONT></DIV><BR>
<DIV class=OutlookMessageHeader lang=es dir=ltr align=left>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>De:</B> Luis Freitas [mailto:lfreitas34@yahoo.com] 
<BR><B>Enviado el:</B> viernes, 10 de octubre de 2008 10:34<BR><B>Para:</B> 
Dante Garro<BR><B>CC:</B> 'ocfs2-users@oss.oracle.com'<BR><B>Asunto:</B> Re: 
[Ocfs2-users] New node..new problems<BR></FONT><BR></DIV>
<DIV></DIV>
<TABLE cellSpacing=0 cellPadding=0 border=0>
  <TBODY>
  <TR>
    <TD vAlign=top>Dante,<BR><BR>&nbsp;&nbsp; Your old debian is running OCFS 
      1.4 and your new Centos is running OCFS 1.2, right?<BR><BR>&nbsp;&nbsp; If 
      you are running Centos 5.0 you should be able to install OCFS 1.4. 
      <BR><BR>&nbsp;&nbsp; If not you will need to umount your debian before 
      mounting the Centos. Beware that there are functionalities on OCFS 1.4 
      that are not available on 1.2, that might impact your 
      applications.<BR><BR>&nbsp;&nbsp; Also I am not sure if the disk layout is 
      fully compatible if certain OCFS 1.4 filesystem options were enabled on 
      your old cluster. The best option would be to upgrade to OCFS 1.4 on the 
      Centos cluster.<BR><BR>Regards,<BR>Luis<BR><BR>--- On <B>Fri, 10/10/08, 
      Dante Garro <I>&lt;dante@bigbyte.com.ar&gt;</I></B> wrote:<BR>
      <BLOCKQUOTE 
      style="PADDING-LEFT: 5px; MARGIN-LEFT: 5px; BORDER-LEFT: rgb(16,16,255) 2px solid">From: 
        Dante Garro &lt;dante@bigbyte.com.ar&gt;<BR>Subject: Re: [Ocfs2-users] 
        New node..new problems<BR>To: "'Tao Ma'" 
        &lt;tao.ma@oracle.com&gt;<BR>Cc: "'ocfs2-users@oss.oracle.com'" 
        &lt;ocfs2-users@oss.oracle.com&gt;<BR>Date: Friday, October 10, 2008, 
        9:05 AM<BR><BR><PRE>Thanks Tao, I've setup the same on both nodes and the cluster becomes<BR>online.<BR>Now, when I try to mount the following errors appears on node 1 (new<BR>CentOS):<BR>(2512,1):o2net_connect_expired:1585 ERROR: no connection established with<BR>node 0 after 30.0 seconds, giving up and returning errors.<BR>(3022,1):dlm_request_join:901 ERROR: status = -107<BR>(3022,1):dlm_try_to_join_domain:1049 ERROR: status = -107<BR>(3022,1):dlm_join_domain:1321 ERROR: status = -107<BR>(3022,1):dlm_register_domain:1514 ERROR: status = -107<BR>(3022,1):ocfs2_dlm_init:2024 ERROR: status = -107<BR>(3022,1):ocfs2_mount_volume:1133 ERROR: status = -107<BR>ocfs2: Unmounting device (147,0) on (node 1)<BR><BR>And the following
 on node 0 (old Debian)<BR><BR> (2228,0):o2net_check_handshake:1093 node nodo2 (num 1) at<BR>192.168.168.2:7777 advertised net protocol version 103 but 2 is required,<BR>disconnecting<BR><BR>I believe the Debian message is clear, protocol version incompatibility.<BR><BR>Are there a way to resolve it?<BR><BR>Thanks<BR><BR>Dante<BR><BR><BR>-----Mensaje original-----<BR>De: Tao Ma [mailto:tao.ma@oracle.com] <BR>Enviado el: viernes, 10 de octubre de 2008 1:25<BR>Para: Dante Garro<BR>CC: 'Sunil Mushran'; 'ocfs2-users@oss.oracle.com'<BR>Asunto: Re: [Ocfs2-users] New node..new problems<BR><BR><BR>Hi,<BR>Dante Garro wrote:<BR>&gt; Sunil, now I fall in count of messages are related to node 0, but the <BR>&gt; new is node 1 and does not care about the value I've setup allways<BR>says<BR>14000 ms.<BR>&gt; Do this change your diagnostic?<BR>Node1 start connection with node0, so you see the messages related to node0<BR>on node1. It looks like your configuration in
 node1 is wrong.<BR>Please make sure that value of O2CB_HEARTBEAT_THRESHOLD in<BR>/etc/sysconfig/o2cb of node1 is the same as that in node0.<BR><BR>Regards,<BR>Tao<BR><BR>&gt; <BR>&gt; <BR>&gt; -----Mensaje original-----<BR>&gt; De: Sunil Mushran [mailto:sunil.mushran@oracle.com] Enviado el: <BR>&gt; Jueves, 09 de Octubre de 2008 06:02 p.m.<BR>&gt; Para: Dante Garro<BR>&gt; CC: 'ocfs2-users@oss.oracle.com'<BR>&gt; Asunto: Re: [Ocfs2-users] New node..new problems<BR>&gt; <BR>&gt; Yeah the cluster timeouts are not consistent. Update and restart the <BR>&gt; cluster on the new node (or all nodes as the case might be).<BR>&gt; <BR>&gt; Hint: cat /sys/kernel/config/cluster/&lt;clustername&gt;/idle_timeout_ms<BR>&gt; to see the active heartbeat threshold.<BR>&gt; <BR>&gt; Dante Garro wrote:<BR>&gt;&gt; Hi all, because problems with ocfs2 release of Debian distribution <BR>&gt;&gt; decided to remake my cluster replacing it by CentOS
 based<BR>installation.<BR>&gt;&gt; Started replacing one of the nodes keeping the other working.<BR>&gt;&gt;<BR>&gt;&gt; On this recently created node the following errors appears:<BR>&gt;&gt;<BR>&gt;&gt; drbd0: Writing meta data super block now.<BR>&gt;&gt; (2558,1):o2hb_check_slot:881 ERROR: Node 0 on device drbd0 has a dead <BR>&gt;&gt; count of 14000 ms, but our count is 130000000 ms.<BR>&gt;&gt; Please double check your configuration values for<BR>&gt; 'O2CB_HEARTBEAT_THRESHOLD'<BR>&gt;&gt; OCFS2 1.2.9 Wed Sep 24 19:26:41 PDT 2008 (build<BR>&gt;&gt; a693806cb619dd7f225004092b675ede)<BR>&gt;&gt; (2520,1):o2net_connect_expired:1585 ERROR: no connection established <BR>&gt;&gt; with node 0 after 30.0 seconds, giving up and returning errors.<BR>&gt;&gt; (2556,1):dlm_request_join:901 ERROR: status = -107<BR>&gt;&gt; (2556,1):dlm_try_to_join_domain:1049 ERROR: status = -107<BR>&gt;&gt; (2556,1):dlm_join_domain:1321 ERROR: status = -107<BR>&gt;&gt;
 (2556,1):dlm_register_domain:1514 ERROR: status = -107<BR>&gt;&gt; (2556,1):ocfs2_dlm_init:2024 ERROR: status = -107<BR>&gt;&gt; (2556,1):ocfs2_mount_volume:1133 ERROR: status = -107<BR>&gt;&gt; ocfs2: Unmounting device (147,0) on (node 1)<BR>&gt;&gt; (2591,1):o2hb_check_slot:881 ERROR: Node 0 on device drbd0 has a dead <BR>&gt;&gt; count of 14000 ms, but our count is 130000000 ms.<BR>&gt;&gt; Please double check your configuration values for<BR>&gt; 'O2CB_HEARTBEAT_THRESHOLD'<BR>&gt;&gt; (2520,1):o2net_connect_expired:1585 ERROR: no connection established <BR>&gt;&gt; with node 0 after 30.0 seconds, giving up and returning errors.<BR>&gt;&gt; (2589,1):dlm_request_join:901 ERROR: status = -107<BR>&gt;&gt; (2589,1):dlm_try_to_join_domain:1049 ERROR: status = -107<BR>&gt;&gt; (2589,1):dlm_join_domain:1321 ERROR: status = -107<BR>&gt;&gt; (2589,1):dlm_register_domain:1514 ERROR: status = -107<BR>&gt;&gt; (2589,1):ocfs2_dlm_init:2024 ERROR: status =
 -107<BR>&gt;&gt; (2589,1):ocfs2_mount_volume:1133 ERROR: status = -107<BR>&gt;&gt; ocfs2: Unmounting device (147,0) on (node 1)<BR>&gt;&gt;<BR>&gt;&gt; I've changed the parameter O2CB_HEARTBEAT_THRESHOLD according O2CB<BR><BR>&gt;&gt; adviced me, but It don't resolve the issue.<BR>&gt;&gt;<BR>&gt;&gt; I hope someone could give me a clue.<BR>&gt;&gt;<BR>&gt;&gt; Thanks in advance.<BR>&gt;&gt;<BR>&gt;&gt; Dante<BR>&gt;&gt;<BR>&gt;&gt;<BR>&gt;&gt; _______________________________________________<BR>&gt;&gt; Ocfs2-users mailing list<BR>&gt;&gt; Ocfs2-users@oss.oracle.com<BR>&gt;&gt; http://oss.oracle.com/mailman/listinfo/ocfs2-users<BR>&gt;&gt;   <BR>&gt; <BR>&gt; _______________________________________________<BR>&gt; Ocfs2-users mailing list<BR>&gt; Ocfs2-users@oss.oracle.com<BR>&gt; http://oss.oracle.com/mailman/listinfo/ocfs2-users<BR><BR>_______________________________________________<BR>Ocfs2-users mailing
 list<BR>Ocfs2-users@oss.oracle.com<BR>http://oss.oracle.com/mailman/listinfo/ocfs2-users<BR></PRE></BLOCKQUOTE></TD></TR></TBODY></TABLE><BR></BODY></HTML>