NFS

An Innocent Mount Issue

I work as a freelance contractor for about a year now, I quit a 10+ years regular CTO job to give into more technical subjects, troubleshoot, code, build infrastructures, A-Team style, I help companies with complex matters that might require experience and rigorousness.

One of my last missions was really, really fun to deal with. A rather big company handling scientific, secret-level data, had an issue with their storage system.
They use Infiniband as their communication layer on an HPC environment, it was not a problem while the underlying operating system was CentOS 7.1 with kernel 3.10.0-1160, but since new machines were installed with CentOS 7.7 and up, with kernels 3.10.0-1062 and up, whenever they wrote a file less than 701 bytes long, the file would be corrupted.
For the record and understanding of the following debugging session, the company uses NFS over RDMA, the latter being the technique used by Infiniband to achieve low latency and great throughput.

nfs send error 65

Proceeding with my Christmas presents, I have refactored my ${HOME} lab. One of the goals was to migrate my public gateway to a diskless Soekris Net6501 my beloved wife offered me :)

The overall PXE/NFS process is explained a billion times over the Internet, only particular point here is that I used dnsmasq instead of ISC DHCP.

Nevertheless I came across an issue that took me way too long to understand; while the boot process seemed perfectly fine, at some point, after Setting up ttys, init hung and the kernel showed the following message:

Flaix, la formule anti-aigr'

Le retour de l’île est toujours un moment difficile. Lorsqu’on a passé deux semaines dans la joie, la fête, parmi les siens, baigné dans une culture aux antipotes de la jérémiade permanente, revenir au pays qui a fait de la plainte son leitmotiv est psychologiquement très angoissant. Une conséquence de cette aversion, c’est que pendant plusieurs semaines, je serai totalement imperméable, voire volontairement réfractaire à l’information politique et sociale. Cette façon de présenter l’actualité, plaintive à outrance, me fatigue et n’aide pas à l’atterrissage en douceur tant le choc culturel est immense. L’autre conséquence, c’est que je prépare mon départ définitif, très probablement dans l’une des deux capitales de la péninsule. Cette migration n’aura probablement pas lieu avant plusieurs années, je ne m’étendrai donc pas plus, je la prépare, c’est tout.

OpenSolaris nfs client: "permission denied"

Petite astuce, ça evitera de chercher trop loin. J’ai constaté que, par defaut, mon desktop OpenSolaris ne parvenait pas à lister le contenu d’un serveur NFS situé sur une Debian GNU/Linux testing.

Quelques recherches m’ont conduit sur ce thread ou l’on comprend que l’implémentation de NFSv4 n’est pas encore totalement synchro entre Linux et Solaris. Ainsi, il suffit de modifier la valeur de NFS_CLIENT_VERSMAX dans le fichier /etc/default/nfs sur le client OpenSolaris de cette façon :