<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=UTF-8">
  </head>
  <body bgcolor="#ffffff" text="#000000">
    <font size="+1">Hi<br>
      <br>
      I'm experiencing the following problem while using OCFS2 over DRBD
      partition.<br>
      <br>
      My config is the following:<br>
      <br>
      2 servers with pacemaker+corosync stack configured<br>
      <br>
      Debian Lenny/Squeeze mixed:<br>
      <br>
      kernel - linux-image-2.6.32-bpo.5-amd64 (2.6.32-26~bpo50+1)<br>
      kernel modules - drbd = 8.3.7 (api:88/proto:86-91) ocfs2 = 1.5.0 <br>
      <br>
      packages:<br>
      <br>
      pacemaker = 1.0.9.1<br>
      corosync = 1.2.1-2<br>
      dlm-pcmk = 3.0.12-2<br>
      ocfs2-tools-pacemaker(contains ocfs2_controld.pcmk binary )=1.4.4-3<br>
      ocfs2-tools = 1.4.4-3<br>
      <br>
      Kernel trace follows here:<br>
      <br>
      <br>
      [ 3128.804789] block drbd0: Handshake successful: Agreed network
      protocol version 91<br>
      [ 3128.805094] block drbd0: Peer authenticated using 20 bytes of
      'sha1' HMAC<br>
      [ 3128.805176] block drbd0: conn( WFConnection -&gt;
      WFReportParams ) <br>
      [ 3128.805274] block drbd0: Starting asender thread (from
      drbd0_receiver [4776])<br>
      [ 3128.805533] block drbd0: data-integrity-alg: &lt;not-used&gt;<br>
      [ 3128.805626] block drbd0: drbd_sync_handshake:<br>
      [ 3128.805695] block drbd0: self
      B4F22E41814A97AB:ADC1DEC415E06ACD:0E1A98B5C70EAE0E:578A64518662F9CF
      bits:202 flags:0<br>
      [ 3128.805788] block drbd0: peer
      ADC1DEC415E06ACC:0000000000000000:0E1A98B5C70EAE0E:578A64518662F9CF
      bits:0 flags:0<br>
      [ 3128.805880] block drbd0: uuid_compare()=1 by rule 70<br>
      [ 3128.805953] block drbd0: peer( Unknown -&gt; Secondary ) conn(
      WFReportParams -&gt; WFBitMapS ) <br>
      [ 3129.365716] block drbd0: conn( WFBitMapS -&gt; SyncSource )
      pdsk( Outdated -&gt; Inconsistent ) <br>
      [ 3129.365816] block drbd0: Began resync as SyncSource (will sync
      808 KB [202 bits set]).<br>
      [ 3129.441670] block drbd0: Resync done (total 1 sec; paused 0
      sec; 808 K/sec)<br>
      [ 3129.441746] block drbd0: conn( SyncSource -&gt; Connected )
      pdsk( Inconsistent -&gt; UpToDate ) <br>
      [ 3154.019560] block drbd0: peer( Secondary -&gt; Primary ) <br>
      [ 3156.462341] dlm: got connection from 1191233546<br>
      [ 3162.458368] (5378,4):ocfs2_truncate_<a class="moz-txt-link-freetext" href="file:465">file:465</a> ERROR: bug
      expression: le64_to_cpu(fe-&gt;i_size) != i_size_read(inode)<br>
      [ 3162.458466] (5378,4):ocfs2_truncate_<a class="moz-txt-link-freetext" href="file:465">file:465</a> ERROR: Inode
      1714687, inode i_size = 556 != di i_size = 604, i_flags = 0x1<br>
      [ 3162.458586] ------------[ cut here ]------------<br>
      [ 3162.458654] kernel BUG at
/tmp/buildd/linux-2.6-2.6.32/debian/build/source_amd64_none/fs/ocfs2/file.c:465!<br>
      [ 3162.458745] invalid opcode: 0000 [#1] SMP <br>
      [ 3162.458901] last sysfs file:
      /sys/kernel/dlm/D9348641B1E04D0E907EFF8D978F348A/control<br>
      [ 3162.458988] CPU 4 <br>
      [ 3162.459095] Modules linked in: ocfs2 jbd2 ocfs2_nodemanager
      quota_tree ocfs2_stack_user ocfs2_stackglue sha1_generic hmac drbd
      lru_cache cn dlm configfs ip_vs_rr ip_vs sctp crc32c libcrc32c
      nfsd exportfs nfs lockd fscache nfs_acl auth_rpcgss sunrpc ipip
      tunnel4 8021q garp stp xt_MARK iptable_mangle xt_tcpudp
      iptable_filter ip_tables x_tables coretemp w83627hf w83793
      hwmon_vid loop snd_pcsp snd_pcm_oss snd_mixer_oss snd_pcm radeon
      ttm drm_kms_helper snd_timer drm snd i5k_amb soundcore
      i2c_algo_bit container i5000_edac rng_core snd_page_alloc
      edac_core evdev button processor ioatdma dca shpchp pci_hotplug
      i2c_i801 i2c_core ext3 jbd mbcache dm_mod ses enclosure sd_mod
      crc_t10dif sg sr_mod cdrom ata_piix ata_generic libata aacraid
      ehci_hcd uhci_hcd scsi_mod thermal thermal_sys usbcore e1000e
      nls_base [last unloaded: scsi_wait_scan]<br>
      [ 3162.462354] Pid: 5378, comm: apache2 Not tainted
      2.6.32-bpo.5-amd64 #1 X7DBU<br>
      [ 3162.462354] RIP: 0010:[&lt;ffffffffa05e006f&gt;] 
      [&lt;ffffffffa05e006f&gt;] ocfs2_setattr+0x631/0x172a [ocfs2]<br>
      [ 3162.462354] RSP: 0018:ffff8801fa71bc28  EFLAGS: 00010292<br>
      [ 3162.462354] RAX: 0000000000000081 RBX: ffff8801d5afb000 RCX:
      0000000000001977<br>
      [ 3162.462354] RDX: 0000000000000000 RSI: 0000000000000092 RDI:
      0000000000000246<br>
      [ 3162.462354] RBP: 0000000000000000 R08: 000000000000f71d R09:
      000000000000000a<br>
      [ 3162.462354] R10: 0000000000000000 R11: ffffffff811b7371 R12:
      0000000000000000<br>
      [ 3162.462354] R13: ffff8801f8fc5ec8 R14: ffff8801f8fc5ec8 R15:
      ffff8801f8f752a0<br>
      [ 3162.462354] FS:  00007fb03993b710(0000)
      GS:ffff880008d00000(0000) knlGS:0000000000000000<br>
      [ 3162.462354] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033<br>
      [ 3162.462354] CR2: 00000000010ccbc8 CR3: 00000001fd16e000 CR4:
      00000000000006e0<br>
      [ 3162.462354] DR0: 0000000000000000 DR1: 0000000000000000 DR2:
      0000000000000000<br>
      [ 3162.462354] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7:
      0000000000000400<br>
      [ 3162.462354] Process apache2 (pid: 5378, threadinfo
      ffff8801fa71a000, task ffff8801f9d0b880)<br>
      [ 3162.462354] Stack:<br>
      [ 3162.462354]  000000000000022c 000000000000025c 0000000000000001
      ffff880227649000<br>
      [ 3162.462354] &lt;0&gt; ffff8801f8fc5b60 ffff8801fa71bd68
      ffff880227649000 0000000100000292<br>
      [ 3162.462354] &lt;0&gt; ffff8801fa4bc800 ffff8801f8fc5b78
      000000004cee87ac ffff880227649000<br>
      [ 3162.462354] Call Trace:<br>
      [ 3162.462354]  [&lt;ffffffff81051f59&gt;] ?
      current_fs_time+0x1e/0x24<br>
      [ 3162.462354]  [&lt;ffffffff81100bbb&gt;] ?
      notify_change+0x180/0x2c5<br>
      [ 3162.462354]  [&lt;ffffffff810ed880&gt;] ? do_truncate+0x63/0x7e<br>
      [ 3162.462354]  [&lt;ffffffff810f5a18&gt;] ?
      get_write_access+0x18/0x4b<br>
      [ 3162.462354]  [&lt;ffffffff810f7c17&gt;] ? may_open+0x191/0x1c8<br>
      [ 3162.462354]  [&lt;ffffffff810f84fa&gt;] ?
      do_filp_open+0x4bf/0x94b<br>
      [ 3162.462354]  [&lt;ffffffff810f1833&gt;] ? cp_new_stat+0xe9/0xfc<br>
      [ 3162.462354]  [&lt;ffffffff810ecb5f&gt;] ? do_sys_open+0x55/0xfc<br>
      [ 3162.462354]  [&lt;ffffffff81010b42&gt;] ?
      system_call_fastpath+0x16/0x1b<br>
      [ 3162.462354] Code: 89 fb 62 a0 65 8b 14 25 a8 e3 00 00 89 44 24
      10 48 8b 43 20 48 63 d2 48 89 44 24 08 49 8b 46 68 48 89 04 24 31
      c0 e8 0e 92 d1 e0 &lt;0f&gt; 0b eb fe 49 39 cc 48 8b 05 c3 7b f8
      ff 0f 86 b1 00 00 00 a9 <br>
      [ 3162.462354] RIP  [&lt;ffffffffa05e006f&gt;]
      ocfs2_setattr+0x631/0x172a [ocfs2]<br>
      [ 3162.462354]  RSP &lt;ffff8801fa71bc28&gt;<br>
      [ 3162.469653] ---[ end trace 3a74db6ea3c5066f ]---<br>
      <br>
      <br>
      I don't know how to exactly reproduce this bug. Kernel doesn't
      stall after hiting this bug. But it is rather annoying and I am
      worried about file system consistency.<br>
      <br>
      Any help would be appreciated.<br>
      <br>
      <br>
    </font>
    <pre class="moz-signature" cols="72">-- 
Yours Faithfully

Vladimir Kuklin

Network Services Specialist
JSC "SMM"
51/4 build. 1, Shepkina str.
Moscow, 129110
Russia

phone +74952296363 ext. 1514
fax +74952296365
cell +79197848963

e-mail <a class="moz-txt-link-abbreviated" href="mailto:v.kuklin@smm.ru">v.kuklin@smm.ru</a>
site <a class="moz-txt-link-freetext" href="http://smm.ru">http://smm.ru</a>
</pre>
  </body>
</html>