2025年10月

10月30日(木)

年末調整の手続き終わらせた。住宅関連は確定申告でやる。来年はちゃんとしないと。

研究室ミーティングの動画アップロード。

GitHub演習。GitHubのUIが変わっているのを修正。また、ssh-keygenでrsaを作らせていたのを、デフォルトのed25519に修正。

論文の査読レポートを完成させた。これでレポートが返ってきた3編のうち、2編について対応完了(本文修正はまだだが)。3編目に取り掛かる。

研究室配属説明会の準備。K-LMSを少し修正。研究室ウェブサイトも少し修正。

レポート300枚/週を乗り切り、レポート200枚週になって少し余裕が出てきた。11月中に3編とも再投稿する!(固い決意)

10月29日(水)

午前中は会議。

なんか、最近日記を書けてないなぁ。時間がないわけじゃないけど、心に余裕がない。でもSNSより日記のほうがいい感じがしてきた。

SNSはどうしても、情報を発信しようとする。なんか、情報の受け手を意識する。でも公開日記は、公開はしているけど基本的には自分用メモ。昔、研究者で公開日記が流行ってたけど、あの方が良かったな。なんかみんなSNSに移っちゃったけど、喧嘩してる人とかが多くて見なくなっちゃった。

あと、SNS、というかXだけど、「おすすめ欄」の慣性が小さすぎて、「いいね」どころか、ポストをクリックしただけで「興味がある」と認定されてしまう。結果、「◯◯の論文がpublishされました」をクリックしただけで、研究者のポストに興味があると認識され、別の研究者が喧嘩しているポストが「おすすめ」に現れだしてげんなり。

Zennのトレンドも、大部分が機械学習、というかLLM系コーディングツールのノウハウばかりになって興味が持てない。

以前、ニュースアプリを試していたのだが、なんかうまく合わずにやめてしまった。また個人用レコメンドシステムを持ったニュースを探してみるかなぁ。

年末調整手続きしようとしたら、「令和X年分住宅借入金等特別控除証明書」の取得を忘れていてできない。これ、電子配布を希望したのでe-taxからダウンロードする必要があり、それにはマイナンバーカードが必要で、マイナンバーカードは家だ。

こういう手続がずっと終わらないで残るの、すごいストレス。

前のヘッドセットが壊れて、新たに「サンワサプライ USBヘッドセット MM-HSU10GMN」を使っているのだが、なんかマイクが拾う音が大きくなったり小さくなったりしているらしい。で、今日のZoom会議で似たようなことが起きている。ノイズキャンセリングが問題を起こしているのかと思ったが、どうも指向性マイクの指向性が強すぎるのが原因っぽい?

物理情報工学ソフトウェア開発演習の演習第一回のレポート採点完了。

研究室ミーティング。

論文への査読の返事、一つ完成。

家に帰ってマイナンバーカードでe-Taxに入ろうとしたら電子証明書の期限が切れている。そういえば切れていたのでセンターに更新の予約をしたのだが、予約がいっぱいですごく後の日付しか取れなかったんだった。つまり、期限内に年末調整の手続きに「住宅借入金等特別控除証明書」を提出することは不可能。まず無しでやって確定申告で申請するしかない。今年は教科書書いたからどうせ確定申告はするんだけど、なんかこういう雑用ドミノはメンタルに来る・・・

10月28日(火)

プログラミング基礎同演習第四回。フラクタル図形。

査読の返事続き。

10月27日(月)

1on1。

論文査読の返事の準備途中まで。

プログラミング基礎同演習のレポートの採点残り。

GitHub演習第二回。

研究室見学対応。これで見学は一段落かな。たくさん見て回って、合う研究室を探してください。

いろいろ仕事が回ってないぞ。

10月26日(日)

GitHub演習のレポート採点。

プログラミング基礎同演習のレポートを7割ほど採点。

10月25日(土)

NOP

10月24日(金)

午前中は打ち合わせ。

GitHub演習第二回。スライド少し修正。

研究室見学対応。

だめだ、今日も集中力を著しく欠いている。

10月23日(木)

なんか集中力が極めて低いなぁ。

読んでたなろう小説、よくある鈍感系主人公ハーレムものだったんだけど、主人公が一人に決めた上にIF系分岐もなくて驚いた。

最近、なろう小説で「はずれ」を引くことがおおくなり、前に好きだった小説を読み返したりしている。作業用BGMもAI系が増えてきており、今後は小説もAI生成のものを読むようになるんじゃなかろうか。自分の好みの設定、結末で、フレーバーだけ変えたものが大量に生成できるので、一生読み続けられるわけだ。うーむ。

WindowsにJavaをインストール。CrowdWalkではJDK 17でよいのだが、JDK 25を選んでみた。

OracleのJava Downloadページへ。とりあえずx64 Installerを選択。

インストール後、Git Bashで見えるか見てみる。

$ java --version
java 25.0.1 2025-10-21 LTS
Java(TM) SE Runtime Environment (build 25.0.1+8-LTS-27)
Java HotSpot(TM) 64-Bit Server VM (build 25.0.1+8-LTS-27, mixed mode, sharing)

$ java --list-modules | grep javafx

Javaは入ったが、JavaFXは入ってないな。

https://openjfx.io/に行ってダウンロード。

ダウンロードしたopenjfx-21.0.9_windows-x64_bin-sdk.zipを展開して、出てきたjavafx-sdk-21.0.9C:\Program Files\Javaに移動。

export PATH=“C:Files”:$PATH export CLASSPATH=“C:Files-sdk-21.0.9” export JAVAFX_HOME=“C:Files-sdk-21.0.9”

$ export CLASSPATH=.
$ javac --module-path "C:\Program Files\Java\javafx-sdk-21.0.9\lib" --add-modules javafx.controls HelloFX.java
java --module-path "C:\Program Files\Java\javafx-sdk-21.0.9\lib" --add-modules javafx.controls HelloFX

これで実行できた。しかし、gradleが動かない。JDK25だと新しすぎるらしい。

25をアンインストールして、21をインストール。

export JAVA_HOME="C:\Program Files\Java\jdk-21"
./gradlew

できた。

CrowdWalk動いた!

10月22日(水)

午前は健康診断。

年末調整のメールアドレス登録。そのうちメールがくるはず。11月4日までに保険料控除などの手続きをすること。

査読論文対応。

研究室ミーティング。

査読レポートへの返事。

年末調整のメールきた。途中まで入力。

10月21日(火)

Ubuntu 22.04にJavaFXを入れたい。

sudo apt install openjdk-19-jdk

まだ途中。

DockerからXを飛ばす方法を確定させないといろいろ面倒だな。

学会の旅費手続きで添付すべきファイルを間違えたので修正。今回の手続きは本当にガタガタで、事務の人に大変迷惑をかけている。申し訳ない。

プログラミング基礎同演習のレポートの返事を修正してアップロード。完全に泥縄になっている・・・

講義と1on1のあと、長らく手をつけられていなかった査読レポートへの返事に取り組む。あらかた書けたはず。

10月20日(月)

招待講演会のアレンジ。

GitHub演習で、最近のVSCodeが自動で日本語化を提案しなくなったのを反映。また、講義スライドではなく課題PDFを使うよう指示。

GitHub演習。その後研究室見学に大勢きた。

論文の査読に返事。再投稿は断念。Reject判定だったが、査読者から多くのフィードバックをもらったので大幅に書き換えて別のところに再チャレンジする。

10月19日(日)

最近は家でも大学でもわりとトップスピードで仕事しているのでわりとしんどい。

GitHub演習の座学第三回、7割くらいレポート採点した。

AIの話。なんか最近のBGMはAI作曲のものが多い。なんか主張しすぎないのでBGMにちょうど良い。

今はまだBGMにとどまっているが、そのうち小説、漫画、アニメ、映画が全てAI生成可能になるだろう。そして僕が「AI生成のもので良い」と思うようになるだろう。

なんとなく怖いというか、悲しい気もするが、僕がエンターテインメントに求めるものがそれくらいなので、仕方ないかもしれない。

10月18日(土)

潜水艇タイタンの事故の最終報告書

読んでみるといろいろと暗くなる。なんかチャレンジャー号の事故報告を思い出す。

プログラミング基礎同演習のレポート採点。どんなに急いでも2時間はかかるな。100人近くいるしなぁ・・・

10月17日(金)

古いマシンのディスクが圧迫されたの、仮想ハードディスクのせいらしい。これ、ファイルを消すだけではだめで、論理的にファイルを消したあと、なんらかの方法で圧縮しないといけない。

マシンの設定続き。

Docker Desktopをインストール。

X11をインストール。

なんか最近のWSLは何もしないでもX11が飛ぶな。lab_startupを修正。

あと、何かするたびに「ポロロン」ってうるさいので無効化。

~/.inputrcを作成して以下を記述。

set bell-style none

端末再起動か、

bind -f ~/.inputrc

で反映。

CrowdWalkを生で実行してみる。

Macにインストール。JDKをbrewで入れてみる。

brew install openjdk@17
echo 'export PATH="/usr/local/opt/openjdk@17/bin:$PATH"' >> ~/.zshrc
echo 'export JAVA_HOME=$(/usr/libexec/java_home -v17)' >> ~/.zshrc
$ java -version
openjdk version "17.0.16" 2025-07-15
OpenJDK Runtime Environment Homebrew (build 17.0.16+0)
OpenJDK 64-Bit Server VM Homebrew (build 17.0.16+0, mixed mode, sharing)

OK。

cd github
git clone https://github.com/crest-cassia/CrowdWalk.git
cd ~/CrowdWalk/crowdwalk
./gradlew

クラッシュした。Open JDKにはJavaFXがバンドルされていないかららしい。

brew uninstall openjdk@17

大人しくLiberica JDK 17 x86をインストールする。

brew tap bell-sw/liberica
brew install --cask liberica-jdk17-full
export JAVA_HOME="/Library/Java/JavaVirtualMachines/liberica-jdk-17-full.jdk/Contents/Home"
export PATH="$JAVA_HOME/bin:$PATH"
$ java --list-modules | grep javafx
javafx.base@17.0.16
javafx.controls@17.0.16
javafx.fxml@17.0.16
javafx.graphics@17.0.16
javafx.media@17.0.16
javafx.swing@17.0.16
javafx.web@17.0.16

できた。JavaFXが必要だったらしい。

Ubuntuの場合。

wget -q -O - https://download.bell-sw.com/pki/GPG-KEY-bellsoft | sudo apt-key add -
echo "deb [arch=amd64] https://apt.bell-sw.com/ stable main" | sudo tee /etc/apt/sources.list.d/bellsoft.list
sudo apt-get update
sudo apt-get install bellsoft-java17-full
export JAVA_HOME=/usr/lib/jvm/bellsoft-java17-full-amd64
export PATH=$JAVA_HOME/bin:$PATH

full版をインストールしないとJavaFXが含まれない。

だが動作しない。WSL経由ではOpenGLの3D表示がうまくいかないようだ。ネイティブじゃないと駄目か。

ヘッドセットが壊れたのでAmazon Businessで注文。

GitHub演習。K-LMSにあるパワーポイントのスライドのPDFが古かった。いろいろ直したつもりだったのだが、そこを直し忘れたか。

結局、DockerやWSLなどの仮想環境では無理っぽいな。

10月16日(木)

一応メモ。

ある大学のキャッチコピーに「I am I.」と書いてあり、それが文法的におかしい、さすがFランみたいなつぶやきを見かけた。実はI am I.というのは(少し古めかしく聞こえるが)文法的に正しい。

リチャード三世のAct 5, シーン5にこんな記述がある。

The lights burn blue. It is now dead midnight. Cold fearful drops stand on my trembling flesh. What do I fear? Myself? There’s none else by. Richard loves Richard; that is, I am I. Is there a murderer here? No. Yes, I am. Then fly! What, from myself? Great reason. Why: Lest I revenge. Myself upon myself? Alack, I love myself. Wherefore? For any good That I myself have done unto myself? O no, alas, I rather hate myself For hateful deeds committed by myself. I am a villain.

King Johnにもある。

Madam, by chance but not by truth; what though? Something about, a little from the right, In at the window, or else o’er the hatch: Who dares not stir by day must walk by >night, And have is have, however men do catch: Near or far off, well won is still well shot, And I am I, howe’er I was begot.

あとは、オクスフォード大学の神学教授、Henry Scott Hollandによる「Death Is Nothing At All」にも

Everything remains exactly as it was. I am I, and you are you, and the old life that we lived so fondly together is untouched, unchanged. Whatever we were to each other, that we are still.

という用例が見られる。

まぁ、「Fラン」とバカにした人に教養がなかったというだけの話なんだけど、人を馬鹿にするのはやめようね。

Tahoeになってから、ウィンドウに切り替わりが遅い。具体的には、ブラウザからVSCodeに切り替える時に1秒くらい固まることがある。

これ、どうもElectronの問題らしい。少なくとも、GPUの利用率が100%近くなる問題があったらしい。しかし、迅速なバージョンアップにより修正されたはず。しかし、まだ重いな。

Electron製のアプリに影響するので、VS CodeやSlackなどが影響を受けるっぽい。うーむ。

普段使いのWindows PCのディスク容量が足りずに不具合がおき始めた。いろいろアプリをアンインストールしてもだめ。

わかった。仮想記憶領域vhdファイルが大きくなりすぎてるんだ。vhdを圧縮しても小さくならない。

急遽、異なるPCのセットアップに入る。うーん。

以下、メモ:

sudo apt update
sudo apt upgrade -y
sudo apt install -y subversion

公開鍵を登録し、すぐにサーバからリポジトリを一括でcheckout。いまどきSubversion管理・・・と思わなくはないが、研究教育関連が全部一つのリポジトリに突っ込んであるので、こうして一括で復活できるのは楽だ。

UbuntuとGit Bashの公開鍵をGitHubに登録。

GitHubでパスキーQRコードをスマホで撮影してもサポートされていないと表示される原因がわかった。スマホの写真アプリではダメで、Google Lensを使う必要があった。

とりあえず新しいWindows PCセットアップ完了。明日の講義に間に合った・・・

そして論文修正ができてない・・・

10月15日(水)

GitHub演習のレポート採点続き。まずは座学第一回が終わった。

研究室ミーティング。

GitHub演習のレポート採点続き。座学第二回も終わった。

論文査読対応まで手が回らない・・・

10月14日(火)

プログラミング基礎同演習第二回。

論文の査読返ってきた。Reject…orz

しかし、とても丁寧なレポートが返ってきたので、ちゃんと修正して別のところに出そう。

GitHub演習のレポート採点。

10月13日(月)

リモート作業中にうっかり、

sudo nmcli con down eno1
sudo nmcli con up eno1

をやってしまって接続が切れたノード、物理ログインしてリブートしたら固定IPだけになった。そして、ypbindが走ってるので/homeでpermission denied。まず固定IPを指定してリブート、が最初の作業だな。

まずはNFSのマウント確認。

$ sudo mount -t nfs 192.168.1.20:/home /mnt/home_nfs
Created symlink /run/systemd/system/remote-fs.target.wants/rpc-statd.service → /usr/lib/systemd/system/rpc-statd.service.

この状態で、

$ cd
-bash: cd: /home/watanabe: 許可がありません
$ cd /mnt/home_nfs/watanabe/
$ 

NISでアカウント共有しているので、/homeはpermission deniedだが、/mnt/home_nfs/watanabe/はちゃんと見れる。正しくNIS共有+NFSできてますね。よしよし。

sudo umount /mnt/home_nfs/
sudo mount -t nfs 192.168.1.20:/home /home
cd

/home通った。dfで確認。

$ df | grep home
192.168.1.20:/home  46872928256 27035027456 19837900800   58% /home

よしよし。/etc/fstabを以下のように修正。

/dev/mapper/rl-root     /                       xfs     defaults        0 0
UUID=1a0defb8-f376-4254-8e56-3a9a9cbe949f /boot                   xfs     defaults        0 0
UUID=DD5A-1F2D          /boot/efi               vfat    umask=0077,shortname=winnt 0 2
#/dev/mapper/rl-home     /home                   xfs     defaults        0 0
/dev/mapper/rl-swap     none                    swap    defaults        0 0
192.168.1.20:/home      /home                   nfs     defaults,_netdev  0  0

リブート。ここまでで、

まで通った。

次、slurmのインストール(クライアント)。

/etc/selinux/config

SELINUX=disabled

にしてからreboot。

mungeのインストール

sudo dnf -y install munge

リブートしたら外に繋がらんくなった。なんでだよ・・・

yagami02のdefault gatewayが192.168.1.2なのに、yagami03が192.168.1.1になってた。コマンド履歴を見ると192.168.1.2を指定しているんだけどなぁ。

sudo ip route del default
sudo ip route add default via 192.168.1.2 dev eno1

により通ったので、

sudo nmcli con mod eno1 ipv4.gateway "192.168.1.2"
sudo nmcli con up eno1

で永続化。

あと、nameserverはNetworkManagerが自動生成するので、/etc/resolv.confを手で書いても上書きされてしまう。

sudo nmcli con mod eno1 ipv4.dns "1.1.1.1"
sudo systemctl restart NetworkManager

これで/etc/resolv.confが修正されていることを確認。

改めてmungeのインストール。

ログインノードから計算ノードにmunge.keyのコピーをする必要があるが、/homeを共有しているのでそこを経由して。

sudo cp /etc/munge/munge.key .
sudo cp munge.key /etc/munge/
sudo chown munge:munge /etc/munge/munge.key

追記:chownを忘れてた

sudo dnf install slurm slurm-slurmd munge

slurm.confにyagami03を追加。

ログインノードのslurm.confを/home経由でコピー。

sudo cp slurm.conf /etc/slurm/

計算ノードは6818をあける必要がある。

sudo firewall-cmd --permanent --add-port=6818/tcp
sudo systemctl restart firewalld

追記:firewallの再起動を忘れて、つながらなかった。

ディレクトリの作成と所有者の修正。

sudo mkdir -p /var/spool/slurm/d /var/log/slurm /var/run/slurm
sudo chown -R slurm:slurm /var/spool/slurm /var/log/slurm /var/run/slurm
sudo chmod 755 /var/spool/slurm /var/log/slurm /var/run/slurm

mungeとslurmdを起動。自動起動も追加。

sudo systemctl start munge
sudo systemctl start slurmd
sudo systemctl enable --now munge
sudo systemctl enable --now slurmd

ログインノードで、slurmdctldの再起動。

sudo systemctl restart slurmctld
sudo scontrol reconfigure

sinfoで確認。OK。

その後yagami03を再起動したらまた死んだ。

sudo systemctl enable --now munge
sudo systemctl enable --now slurmd

を設定して自動起動をONにしていなかったのが原因。起動してからログインノードで以下を実行したら復活。

sudo scontrol update nodename=yagami03.appi.keio.ac.jp state=resume

新たにyagami01をセットアップ。今度こそ手順完全版を作る。

USBでRockey Linux 9.6をインストール

/etc/hostsの内容をyagami02からコピー

ホスト名の設定。

sudo hostnamectl set-hostname yagami01

これでhostnamehostname -fが想定通りになることを確認。

固定IPをふり、かつDNSやDefault GWを設定。

sudo nmcli connection modify eno1 ipv4.addresses 192.168.1.11/24
sudo nmcli connection modify eno1 ipv4.gateway 192.168.1.2
sudo nmcli connection modify eno1 ipv4.dns "1.1.1.1"
sudo nmcli connection modify eno1 ipv4.method manual
sudo nmcli connection modify eno1 ipv6.method ignore
sudo nmcli connection up eno1

を実行してから念のためreboot(NetworkManagerだけで良いかもしれないが、接続中だと変な設定が残ることがあるので)。

ホストベース認証。

まずはSELinuxを無効に。

sudo setenforce 0
sudo vim /etc/selinux/config

で、

SELINUX=disabled

に。

ログインノード側で

ssh-keyscan -t ed25519 yagami01 | sudo tee -a /etc/ssh/ssh_known_hosts

計算ノード側で、

ssh-keyscan -t ed25519 watanabe-login.appi.keio.ac.jp | sudo tee -a /etc/ssh/ssh_known_hosts

/etc/ssh/shosts.equivを以下の内容に。

watanabe-login.appi.keio.ac.jp
yagami01
yagami02
yagami03
yagami04

/etc/ssh/sshd_configを以下のように修正。

HostKey /etc/ssh/ssh_host_ed25519_key
IgnoreUserKnownHosts no
HostbasedAuthentication yes
UseDNS yes

計算ノードに2222を開けてsshdを2222で起動。

sudo firewall-cmd --add-port=2222/tcp
sudo /usr/sbin/sshd -d -p 2222

ログインノードから接続確認。

ssh -o PreferredAuthentications=hostbased yagami01 -p 2222

接続できたら、計算ノードでsshdをrestart。

sudo systemctl restart sshd

ログインノードから通常ポートで接続。

ssh -o PreferredAuthentications=hostbased yagami01

接続できたらホストベース認証完成。

次、NISの設定。

DNFのアップデート。

sudo dnf update -y

別ノードで作った以下の3つのRPMをコピーしてインストール。

mkdir build
cd build
scp yagami03:build/*.rpm .
sudo dnf localinstall -y ~/build/ypbind-2.7.2-2.el9.x86_64.rpm ~/build/nss_nis-3.2-8.el9.x86_64.rpm ~/build/yp-tools-4.2.3-2.el9.x86_64.rpm

/etc/yum.confに以下を追加。

exclude=ypbind nss_nis yp-tools authselect-libs autofs
sudo ypdomainname watanabe-group

/etc/yp.confを以下のように修正。

domain watanabe-group server watanabe-login

ypbind起動。

sudo systemctl start ypbind
$ ypwhich
watanabe-login

/etc/nsswitch.confをNISを先に見るように直接編集。

passwd:     nis files sss systemd
group:      nis files [SUCCESS=merge] sss [SUCCESS=merge] systemd
shadow:     nis files

getentが通ることを確認。

getent passwd 適当なユーザ名

通った。

次、NFS。

sudo dnf install -y nfs-utils
sudo mkdir -p /mnt/home_nfs
sudo mount -t nfs 192.168.1.20:/home /mnt/home_nfs

これでマウントできることを確認。

sudo umount /mnt/home_nfs

/etc/fstabを以下のように修正。

/dev/mapper/rl-root     /                       xfs     defaults        0 0
UUID=d35febed-3269-4ca5-b494-27d11a2d387f /boot                   xfs     defaults        0 0
UUID=9032-A23D          /boot/efi               vfat    umask=0077,shortname=winnt 0 2
#/dev/mapper/rl-home     /home                   xfs     defaults        0 0
/dev/mapper/rl-swap     none                    swap    defaults        0 0
192.168.1.20:/home      /home                   nfs     defaults,_netdev  0  0

リブート。/home/が正しくマウントできた。

次、slurm。

mungeのインストール。

sudo dnf -y install munge

既に/homeにmunge.keyがあるので共有。

sudo cp munge.key /etc/munge/
sudo chown munge:munge /etc/munge/munge.key

Slurmのインストール。

sudo dnf groupinstall "Development Tools" -y
sudo dnf install -y epel-release
sudo dnf install -y slurm slurm-slurmd

ログインノードの/etc/slurm/slurm.confにyagami01を追加。

# COMPUTE NODES
NodeName=watanabe-login.appi.keio.ac.jp CPUs=20 State=UNKNOWN
NodeName=yagami01.appi.keio.ac.jp CPUs=20 State=UNKNOWN
NodeName=yagami02.appi.keio.ac.jp CPUs=20 State=UNKNOWN
NodeName=yagami03.appi.keio.ac.jp CPUs=20 State=UNKNOWN
PartitionName=main Nodes=ALL Default=YES MaxTime=1-00:00:00 State=UP

ログインノードで/homeにコピー。

sudo cp /etc/slurm/slurm.conf .

計算ノードでローカルにコピー。

sudo cp slurm.conf /etc/slurm/

6818をあける。

sudo firewall-cmd --permanent --add-port=6818/tcp
sudo systemctl restart firewalld

slurmユーザの作成。

sudo groupadd -g 64030 slurm
sudo useradd -u 64030 -g slurm -m -d /var/lib/slurm -s /sbin/nologin -r slurm
sudo mkdir -p /var/spool/slurm/d /var/log/slurm /var/run/slurm
sudo chown -R slurm:slurm /var/spool/slurm /var/log/slurm /var/run/slurm
sudo chmod 755 /var/spool/slurm /var/log/slurm /var/run/slurm

mungeとslurmdを起動。

sudo systemctl enable --now munge
sudo systemctl enable --now slurmd
sudo systemctl start munge
sudo systemctl start slurmd

計算ノードでslurmctldを再起動して再読み込み。

sudo systemctl restart slurmctld
sudo scontrol reconfigure

計算ノードを認識した。

あとはすべての計算ノードで、

sudo dnf install -y openmpi openmpi-devel

とかやってから、/etc/bashrcに

export PATH=/usr/lib64/openmpi/bin:$PATH

を追加しないとmpirunにパスが通らない。

export PATH=$PATH:/home/apps/lammps
mpirun -np 20 lmp < collision.input 

が全てのノードで通ることを確認。 終わったぞ〜!!!

もう一つの懸案だった、学科ウェブに学生さんの受賞情報を掲載するのもやった。

10月12日(日)

子どものスマホを契約。契約にすげー時間がかかった上、その後の設定にもすげー時間がかかって消耗・・・

疲れて今日はレポートの採点ができなかった・・・

10月11日(土)

会議とか。

プログラミング基礎同演習のレポート採点。すげー時間かかったな。

10月10日(金)

故障したサーバにRockeyを入れ直す。別の計算ノードでバージョン確認。

$ cat /etc/redhat-release 
Rocky Linux release 9.6 (Blue Onyx)

9.6ですね。

MacのターミナルからRockey Linux release 9.6のブータブルUSBを作ろうとしたが、ddを使ったりして危ないな。 ChatGPTにBalena Etcherというのを紹介されたが、ここは大人しくWindowsでRufasを使うか。

https://rufus.ie/ja/からRufasをダウンロード。

Rocky-9.6-x86_64-dvd.isoをダウンロード、しようとしたが、公式サイトからは重すぎる。

理研のミラーからダウンロード。

作業ログ。

疲れたなぁ。

yagai03にNFSのインストール。

sudo dnf install -y nfs-utils
cd /mnt
sudo mkdir home_nfs

失敗する。firewall?

sudo firewall-cmd --permanent --add-service=nfs
sudo firewall-cmd --permanent --add-service=rpc-bind
sudo firewall-cmd --permanent --add-service=mountd
sudo firewall-cmd --reload

ChatGPTの言う通りに作業してて、

sudo nmcli con down eno1
sudo nmcli con up eno1

を叩いてしまい、ネットワーク接続が切れてリモートから作業ができなくなってしまった。アホすぎる。

10月09日(木)

サーバ設定。Rockeyで

sudo dnf update -y

とすると

Error: 
 Problem 1: package authselect-1.2.6-3.el9.x86_64 from baseos requires authselect-libs(x86-64) = 1.2.6-3.el9, but none of the providers can be installed
  - cannot install the best update candidate for package authselect-1.2.6-2.el9.x86_64
  - package authselect-libs-1.2.6-3.el9.x86_64 from baseos is filtered out by exclude filtering
 Problem 2: package authselect-compat-1.2.6-3.el9.x86_64 from appstream requires authselect(x86-64) = 1.2.6-3.el9, but none of the providers can be installed
  - package authselect-1.2.6-3.el9.x86_64 from baseos requires authselect-libs(x86-64) = 1.2.6-3.el9, but none of the providers can be installed
  - cannot install the best update candidate for package authselect-compat-1.2.6-2.el9.x86_64
  - package authselect-libs-1.2.6-3.el9.x86_64 from baseos is filtered out by exclude filtering
(try to add '--skip-broken' to skip uninstallable packages or '--nobest' to use not only best candidate packages)

のようなエラーがでる。これは、/etc/dnf/dnf.conf

exclude=ypbind nss_nis yp-tools authselect-libs autofs

と、authselect-libの除外設定があるから。

Rockeyにslurmインストール。最初にソースからインストールしてしまったので話がややこしくなった。素直にdnfを使うべき。

ログインノードでのジョブ投入は成功。計算ノードからつながらない。

$ nc -zv login-node-name 6817
Ncat: Version 7.92 ( https://nmap.org/ncat )
Ncat: No route to host.

ポートが塞がってますね。ログインノードで以下を実行。

sudo firewall-cmd --zone=public --add-port=6817/tcp --permanent
sudo firewall-cmd --zone=public --add-port=6818/tcp --permanent
sudo firewall-cmd --reload

計算ノードは6818をあける必要がある。

sudo firewall-cmd --permanent --add-port=6818/tcp
sudo systemctl restart firewalld

通った(firewalldを再起動忘れて繋がらなかった・・・)。

次はMPI。計算ノードで以下を実行。

sudo dnf install -y openmpi openmpi-devel

パスを通す。/etc/bashrcに以下を追加。

export PATH=/usr/lib64/openmpi/bin:$PATH
PartitionName=default Nodes=ALL Default=YES MaxTime=INFINITE State=UP

としたらエラー。defaultは予約後だそうで。

PartitionName=main Nodes=ALL Default=YES MaxTime=INFINITE State=UP

としたら通った。

PartitionName=main Nodes=ALL Default=YES MaxTime=1-00:00:00 State=UP

と、24時間制限をつけた。

クラスタにlammpsインストール

cd github
git clone -b release --depth 1  https://github.com/lammps/lammps.git
cd lammps
mkdir build
cd build
cmake ../cmake \
  -D CMAKE_C_COMPILER=mpicc \
  -D CMAKE_CXX_COMPILER=mpicxx \
  -D CMAKE_INSTALL_PREFIX=~/usr/local \
  -D CMAKE_CXX_FLAGS="-O3 -std=c++11 -fopenmp" \
  -D BUILD_MPI=yes \
  -D BUILD_OMP=yes \
  -D CMAKE_EXE_LINKER_FLAGS="-O3 -std=c++11 -fopenmp" \
  -D PKG_MOLECULE=on
make -j 4
make install

無事にログインノード、計算ノードでlammpsも並列に走った。よし。これで研究室クラスター復活。

・・・疲れたなぁ。

10月08日(水)

会議。

来年度に向けて、博士号取得のスケジュール確認をするなどした。

デロイトがオーストラリア連邦政府から受託した報告書をAIを使って書いたのがバレて返金

存在しない参考文献でバレたとのこと。デロイトは「報告内容には変更はない」と言っているけれど、「主要な部分もAIで書いたのでは?」と思われるよね・・・

研究室ミーティング。シアシックニングと格闘ゲームの強化学習。今日から本格的に英語での発表です。

NIS共有の設定続き。うまくNIS共有できなかったのはサーバ側のポートが閉じていたから。

サーバ側で

sudo firewall-cmd --permanent --add-port=861/tcp
sudo firewall-cmd --permanent --add-port=861/udp
sudo firewall-cmd --permanent --add-port=111/tcp
sudo firewall-cmd --permanent --add-port=111/udp
sudo firewall-cmd --reload

を実行することでポートが通った。

クライアント側で

sudo /usr/sbin/ypbind -d

を実行することでどこでこけているかがわかる。ypwhichやgetentが通るようになった時点で

sudo systemctl start ypbind

で通った。

クライアントでypbindが自動起動するか確認。

$ sudo systemctl is-enabled ypbind
enabled

大丈夫ですね。

Slurmのインストール途中で時間切れ。

ノーベル化学賞が日本人受賞でバタバタ・・・

10月07日(火)

田園都市線、昨日の深夜に復旧。今日は普通につかえてよかった。

夜は物理学会のノーベル賞対応でバタバタ。

10月06日(月)

昨夜、田園都市線が脱線事故を起こし、最寄り駅が全く動かなくなってしまった。 しばらくしたら復活するかと思ったが、全く復活しなかったので、息子は別の経路で登校。僕は在宅勤務に。

ちょっと接触しただけらしいので、すぐ復旧すると思っていたが、まさか今日一日ずっと不通だとは思わなかった。

息子が帰れないので、車で学校まで迎えにいった。

計算科学春の学校の飛行機とかホテルとかの予約した。こういうの疲れるな。

10月05日(日)

NOP

NOPといいつつ、なんか毎週土日に車での子供の送り迎えがあるから相当疲れる・・・

10月04日(土)

NOP

10月03日(金)

1on1とか。

GitHub演習のガイダンスの準備でバタバタした。アナウンスには正しいURLを書いたが、モジュールのページのZoomのURLが古いままだった。 来年は気をつけないと。

ガイダンスに引き続き、今年から生成AIとの付き合い方のガイダンスも追加。

生成AIとの付き合い方

出張申請がボロボロだった。事務の方にいろいろご迷惑をおかけした。大変申し訳ありません。後で修正されたバージョンを確認して、来年から気をつけます。

査読返した。

研究室のジョブスケジューラ確認。Rocky+OpenPBSではトラブルが多いらしい。Slurmだとすぐ入るっぽい。試さないと(いつ?)。

10月02日(木)

講義動画が全てBoxだったのを、K-LMSのVideoにすべて修正した。相当時間かかった。

あと、プログラミング基礎同演習の動画内の回数が間違っているな。確か、コロナの時に講義回数が一回減って、その後追加したからズレたんだな。

講義のガイダンス用の「生成AIとの付き合い方」のスライド最終調整。完成したことにする。GitHub演習とプログラミング基礎同演習で使う予定。

山本さんが日本生物物理学会学生発表賞を受賞。おめでとうございます!

研究室ミーティング。やっぱり英語でやるの結構大変だな。

出版社からの問い合わせを返した。

10月01日(水)

10月になってしまった。毎月これ書いてない?

GitHub演習の班分け表忘れてた。慌てて作る。

昨日注文した留学生用PCが今日届いた。素晴らしい。早速留学生さんと一緒にセットアップ。

プログラミング基礎同演習とGitHub演習のアナウンス投げた。

明日の発表スライド作った。

講義のガイダンス用の「生成AIとの付き合い方」のスライド生成した。

秋学期の講義が始まるのでバタバタする。