NFS que muestra files en el directory, pero no se puede abrir o stat

Estoy utilizando una networking de máquinas Linux (Debian Squeeze en kernel 2.6.32), compartiendo files usando NFS (v3). El escenario es que un process que se ejecuta en el cliente A creará un file a través de NFS en el server de files Z. Entonces, después de que el process termine de ejecutarse en A (descargando su salida y cerrando el file), el cliente B intentará acceder al file. 99.9% del time no hay ningún problema con este enfoque.

El problema es que muy raramente el cliente B al intentar leer lanzará un error que dice que el file no existe. La arruga es que B siempre muestra el file cuando se hace un "ls" o readdir en el directory que contiene. Sin embargo, al intentar abrir, o incluso llamar a "stat" en el file de la no existe el error se lanza.

Algunos puntos adicionales:

  • Los files sólo se escriben una vez en un solo cliente, pero pueden ser leídos muchas veces por muchos clientes diferentes (WORM). Los files tampoco se eliminan en el process.
  • Cuando aparecen los errores, sólo parecen afectar a algunos de los clientes (random). Otros clientes pueden abrir y leer los files sin ningún problema. Además, cuando el problema ocurre tiende a ocurrir repetidamente. Reiniciar el server de files y volver a montar en los clientes parece eliminar el problema
  • El file se puede leer después de time suficiente. Podría estar en cualquier lugar de unos segundos a diez minutos. A veces desaparecerá inmediatamente después de un readdir en el directory que contiene, a veces no lo hará.
  • Inicialmente sospeché que era un problema de coinheritance de caching de attributes NFS. Así que vuelvo a montar con la opción noac habilitada. El problema siguió apareciendo (además de ser grindingly lento).
  • El problema sólo aparece durante el tráfico NFS pesado cuando se crean una gran cantidad de files grandes, escritos y leídos.
  • Nada que indique un problema aparece en ninguno de los syslogs o dmesg en el lado del cliente o del server.

Sospecho firmemente que esto es un problema de coinheritance de caching NFS de algún tipo. Pero no puedo averiguar cuál podría ser la causa exacta o la posible solución. A less que esté malentendiendo el manual de NFS, este tipo de comportamiento debe ser excluido por la coinheritance de caching de cerca a abrir. ¿Alguien más ha tenido experiencia con este problema de los files NFS que existen para la llamada al sistema "readdir", pero no existen para la llamada al sistema "stat"? Cualquier idea sería muy apreciada. Gracias.

  • ¿Cómo puedo usar POSIX ACL en un soporte NFSv4 en Linux?
  • ¿Por qué se deniega el permiso con NFS después de reiniciar?
  • Mejores opciones de sistema de files para NFS que almacena imágenes de disco de VMware
  • ¿Cómo puede Linux montar un directory NFS, y los filesystems montados en su interior?
  • ¿Por qué Nexenta parece ignorar mi configuration de / etc / system?
  • ¿Cómo supervisar a qué files se accede a través de NFS?
  • El cliente NFS no recupera el server después de reiniciar
  • Conectividad de networking en el clúster HPC
  • Permisos de files de volumen NFS
  • CentOS 6: No se puede iniciar NFS
  • ¿El cliente NFS de Windows (Servicios para Unix) es "lo suficientemente bueno"?
  • Lectura de performance de Apache 2 desde el server de files NFS en EC2
  • Descripción de NFS4 (server Linux)
  • El linux y los temas del servidor de Windows, como ubuntu, centos, apache, nginx, debian y consejos de red.