NFS que muestra files en el directory, pero no se puede abrir o stat

Estoy utilizando una networking de máquinas Linux (Debian Squeeze en kernel 2.6.32), compartiendo files usando NFS (v3). El escenario es que un process que se ejecuta en el cliente A creará un file a través de NFS en el server de files Z. Entonces, después de que el process termine de ejecutarse en A (descargando su salida y cerrando el file), el cliente B intentará acceder al file. 99.9% del time no hay ningún problema con este enfoque.

El problema es que muy raramente el cliente B al intentar leer lanzará un error que dice que el file no existe. La arruga es que B siempre muestra el file cuando se hace un "ls" o readdir en el directory que contiene. Sin embargo, al intentar abrir, o incluso llamar a "stat" en el file de la no existe el error se lanza.

Algunos puntos adicionales:

  • Los files sólo se escriben una vez en un solo cliente, pero pueden ser leídos muchas veces por muchos clientes diferentes (WORM). Los files tampoco se eliminan en el process.
  • Cuando aparecen los errores, sólo parecen afectar a algunos de los clientes (random). Otros clientes pueden abrir y leer los files sin ningún problema. Además, cuando el problema ocurre tiende a ocurrir repetidamente. Reiniciar el server de files y volver a montar en los clientes parece eliminar el problema
  • El file se puede leer después de time suficiente. Podría estar en cualquier lugar de unos segundos a diez minutos. A veces desaparecerá inmediatamente después de un readdir en el directory que contiene, a veces no lo hará.
  • Inicialmente sospeché que era un problema de coinheritance de caching de attributes NFS. Así que vuelvo a montar con la opción noac habilitada. El problema siguió apareciendo (además de ser grindingly lento).
  • El problema sólo aparece durante el tráfico NFS pesado cuando se crean una gran cantidad de files grandes, escritos y leídos.
  • Nada que indique un problema aparece en ninguno de los syslogs o dmesg en el lado del cliente o del server.

Sospecho firmemente que esto es un problema de coinheritance de caching NFS de algún tipo. Pero no puedo averiguar cuál podría ser la causa exacta o la posible solución. A less que esté malentendiendo el manual de NFS, este tipo de comportamiento debe ser excluido por la coinheritance de caching de cerca a abrir. ¿Alguien más ha tenido experiencia con este problema de los files NFS que existen para la llamada al sistema "readdir", pero no existen para la llamada al sistema "stat"? Cualquier idea sería muy apreciada. Gracias.

El linux y los temas del servidor de Windows, como ubuntu, centos, apache, nginx, debian y consejos de red.