2025年10月
10月30日(木)
年末調整の手続き終わらせた。住宅関連は確定申告でやる。来年はちゃんとしないと。
研究室ミーティングの動画アップロード。
GitHub演習。GitHubのUIが変わっているのを修正。また、ssh-keygenでrsaを作らせていたのを、デフォルトのed25519に修正。
論文の査読レポートを完成させた。これでレポートが返ってきた3編のうち、2編について対応完了(本文修正はまだだが)。3編目に取り掛かる。
研究室配属説明会の準備。K-LMSを少し修正。研究室ウェブサイトも少し修正。
レポート300枚/週を乗り切り、レポート200枚週になって少し余裕が出てきた。11月中に3編とも再投稿する!(固い決意)
10月29日(水)
午前中は会議。
なんか、最近日記を書けてないなぁ。時間がないわけじゃないけど、心に余裕がない。でもSNSより日記のほうがいい感じがしてきた。
SNSはどうしても、情報を発信しようとする。なんか、情報の受け手を意識する。でも公開日記は、公開はしているけど基本的には自分用メモ。昔、研究者で公開日記が流行ってたけど、あの方が良かったな。なんかみんなSNSに移っちゃったけど、喧嘩してる人とかが多くて見なくなっちゃった。
あと、SNS、というかXだけど、「おすすめ欄」の慣性が小さすぎて、「いいね」どころか、ポストをクリックしただけで「興味がある」と認定されてしまう。結果、「◯◯の論文がpublishされました」をクリックしただけで、研究者のポストに興味があると認識され、別の研究者が喧嘩しているポストが「おすすめ」に現れだしてげんなり。
Zennのトレンドも、大部分が機械学習、というかLLM系コーディングツールのノウハウばかりになって興味が持てない。
以前、ニュースアプリを試していたのだが、なんかうまく合わずにやめてしまった。また個人用レコメンドシステムを持ったニュースを探してみるかなぁ。
年末調整手続きしようとしたら、「令和X年分住宅借入金等特別控除証明書」の取得を忘れていてできない。これ、電子配布を希望したのでe-taxからダウンロードする必要があり、それにはマイナンバーカードが必要で、マイナンバーカードは家だ。
こういう手続がずっと終わらないで残るの、すごいストレス。
前のヘッドセットが壊れて、新たに「サンワサプライ USBヘッドセット MM-HSU10GMN」を使っているのだが、なんかマイクが拾う音が大きくなったり小さくなったりしているらしい。で、今日のZoom会議で似たようなことが起きている。ノイズキャンセリングが問題を起こしているのかと思ったが、どうも指向性マイクの指向性が強すぎるのが原因っぽい?
物理情報工学ソフトウェア開発演習の演習第一回のレポート採点完了。
研究室ミーティング。
論文への査読の返事、一つ完成。
家に帰ってマイナンバーカードでe-Taxに入ろうとしたら電子証明書の期限が切れている。そういえば切れていたのでセンターに更新の予約をしたのだが、予約がいっぱいですごく後の日付しか取れなかったんだった。つまり、期限内に年末調整の手続きに「住宅借入金等特別控除証明書」を提出することは不可能。まず無しでやって確定申告で申請するしかない。今年は教科書書いたからどうせ確定申告はするんだけど、なんかこういう雑用ドミノはメンタルに来る・・・
10月28日(火)
プログラミング基礎同演習第四回。フラクタル図形。
査読の返事続き。
10月27日(月)
1on1。
論文査読の返事の準備途中まで。
プログラミング基礎同演習のレポートの採点残り。
GitHub演習第二回。
研究室見学対応。これで見学は一段落かな。たくさん見て回って、合う研究室を探してください。
いろいろ仕事が回ってないぞ。
10月26日(日)
GitHub演習のレポート採点。
プログラミング基礎同演習のレポートを7割ほど採点。
10月25日(土)
NOP
10月24日(金)
午前中は打ち合わせ。
GitHub演習第二回。スライド少し修正。
研究室見学対応。
だめだ、今日も集中力を著しく欠いている。
10月23日(木)
なんか集中力が極めて低いなぁ。
読んでたなろう小説、よくある鈍感系主人公ハーレムものだったんだけど、主人公が一人に決めた上にIF系分岐もなくて驚いた。
最近、なろう小説で「はずれ」を引くことがおおくなり、前に好きだった小説を読み返したりしている。作業用BGMもAI系が増えてきており、今後は小説もAI生成のものを読むようになるんじゃなかろうか。自分の好みの設定、結末で、フレーバーだけ変えたものが大量に生成できるので、一生読み続けられるわけだ。うーむ。
WindowsにJavaをインストール。CrowdWalkではJDK 17でよいのだが、JDK 25を選んでみた。
OracleのJava Downloadページへ。とりあえずx64 Installerを選択。
インストール後、Git Bashで見えるか見てみる。
$ java --version
java 25.0.1 2025-10-21 LTS
Java(TM) SE Runtime Environment (build 25.0.1+8-LTS-27)
Java HotSpot(TM) 64-Bit Server VM (build 25.0.1+8-LTS-27, mixed mode, sharing)
$ java --list-modules | grep javafxJavaは入ったが、JavaFXは入ってないな。
https://openjfx.io/に行ってダウンロード。
ダウンロードしたopenjfx-21.0.9_windows-x64_bin-sdk.zipを展開して、出てきたjavafx-sdk-21.0.9をC:\Program Files\Javaに移動。
export PATH=“C:Files”:$PATH export CLASSPATH=“C:Files-sdk-21.0.9” export JAVAFX_HOME=“C:Files-sdk-21.0.9”
$ export CLASSPATH=.
$ javac --module-path "C:\Program Files\Java\javafx-sdk-21.0.9\lib" --add-modules javafx.controls HelloFX.java
java --module-path "C:\Program Files\Java\javafx-sdk-21.0.9\lib" --add-modules javafx.controls HelloFXこれで実行できた。しかし、gradleが動かない。JDK25だと新しすぎるらしい。
25をアンインストールして、21をインストール。
export JAVA_HOME="C:\Program Files\Java\jdk-21"
./gradlewできた。
CrowdWalk動いた!
10月22日(水)
午前は健康診断。
年末調整のメールアドレス登録。そのうちメールがくるはず。11月4日までに保険料控除などの手続きをすること。
査読論文対応。
研究室ミーティング。
査読レポートへの返事。
年末調整のメールきた。途中まで入力。
10月21日(火)
Ubuntu 22.04にJavaFXを入れたい。
sudo apt install openjdk-19-jdkまだ途中。
DockerからXを飛ばす方法を確定させないといろいろ面倒だな。
学会の旅費手続きで添付すべきファイルを間違えたので修正。今回の手続きは本当にガタガタで、事務の人に大変迷惑をかけている。申し訳ない。
プログラミング基礎同演習のレポートの返事を修正してアップロード。完全に泥縄になっている・・・
講義と1on1のあと、長らく手をつけられていなかった査読レポートへの返事に取り組む。あらかた書けたはず。
10月20日(月)
招待講演会のアレンジ。
GitHub演習で、最近のVSCodeが自動で日本語化を提案しなくなったのを反映。また、講義スライドではなく課題PDFを使うよう指示。
GitHub演習。その後研究室見学に大勢きた。
論文の査読に返事。再投稿は断念。Reject判定だったが、査読者から多くのフィードバックをもらったので大幅に書き換えて別のところに再チャレンジする。
10月19日(日)
最近は家でも大学でもわりとトップスピードで仕事しているのでわりとしんどい。
GitHub演習の座学第三回、7割くらいレポート採点した。
AIの話。なんか最近のBGMはAI作曲のものが多い。なんか主張しすぎないのでBGMにちょうど良い。
今はまだBGMにとどまっているが、そのうち小説、漫画、アニメ、映画が全てAI生成可能になるだろう。そして僕が「AI生成のもので良い」と思うようになるだろう。
なんとなく怖いというか、悲しい気もするが、僕がエンターテインメントに求めるものがそれくらいなので、仕方ないかもしれない。
10月18日(土)
読んでみるといろいろと暗くなる。なんかチャレンジャー号の事故報告を思い出す。
プログラミング基礎同演習のレポート採点。どんなに急いでも2時間はかかるな。100人近くいるしなぁ・・・
10月17日(金)
古いマシンのディスクが圧迫されたの、仮想ハードディスクのせいらしい。これ、ファイルを消すだけではだめで、論理的にファイルを消したあと、なんらかの方法で圧縮しないといけない。
マシンの設定続き。
Docker Desktopをインストール。
X11をインストール。
なんか最近のWSLは何もしないでもX11が飛ぶな。lab_startupを修正。
あと、何かするたびに「ポロロン」ってうるさいので無効化。
~/.inputrcを作成して以下を記述。
set bell-style none端末再起動か、
bind -f ~/.inputrcで反映。
CrowdWalkを生で実行してみる。
Macにインストール。JDKをbrewで入れてみる。
brew install openjdk@17
echo 'export PATH="/usr/local/opt/openjdk@17/bin:$PATH"' >> ~/.zshrc
echo 'export JAVA_HOME=$(/usr/libexec/java_home -v17)' >> ~/.zshrc$ java -version
openjdk version "17.0.16" 2025-07-15
OpenJDK Runtime Environment Homebrew (build 17.0.16+0)
OpenJDK 64-Bit Server VM Homebrew (build 17.0.16+0, mixed mode, sharing)OK。
cd github
git clone https://github.com/crest-cassia/CrowdWalk.git
cd ~/CrowdWalk/crowdwalk
./gradlewクラッシュした。Open JDKにはJavaFXがバンドルされていないかららしい。
brew uninstall openjdk@17大人しくLiberica JDK 17 x86をインストールする。
brew tap bell-sw/liberica
brew install --cask liberica-jdk17-full
export JAVA_HOME="/Library/Java/JavaVirtualMachines/liberica-jdk-17-full.jdk/Contents/Home"
export PATH="$JAVA_HOME/bin:$PATH"$ java --list-modules | grep javafx
javafx.base@17.0.16
javafx.controls@17.0.16
javafx.fxml@17.0.16
javafx.graphics@17.0.16
javafx.media@17.0.16
javafx.swing@17.0.16
javafx.web@17.0.16できた。JavaFXが必要だったらしい。
Ubuntuの場合。
wget -q -O - https://download.bell-sw.com/pki/GPG-KEY-bellsoft | sudo apt-key add -
echo "deb [arch=amd64] https://apt.bell-sw.com/ stable main" | sudo tee /etc/apt/sources.list.d/bellsoft.list
sudo apt-get update
sudo apt-get install bellsoft-java17-full
export JAVA_HOME=/usr/lib/jvm/bellsoft-java17-full-amd64
export PATH=$JAVA_HOME/bin:$PATHfull版をインストールしないとJavaFXが含まれない。
だが動作しない。WSL経由ではOpenGLの3D表示がうまくいかないようだ。ネイティブじゃないと駄目か。
ヘッドセットが壊れたのでAmazon Businessで注文。
GitHub演習。K-LMSにあるパワーポイントのスライドのPDFが古かった。いろいろ直したつもりだったのだが、そこを直し忘れたか。
結局、DockerやWSLなどの仮想環境では無理っぽいな。
10月16日(木)
一応メモ。
ある大学のキャッチコピーに「I am I.」と書いてあり、それが文法的におかしい、さすがFランみたいなつぶやきを見かけた。実はI am I.というのは(少し古めかしく聞こえるが)文法的に正しい。
リチャード三世のAct 5, シーン5にこんな記述がある。
The lights burn blue. It is now dead midnight. Cold fearful drops stand on my trembling flesh. What do I fear? Myself? There’s none else by. Richard loves Richard; that is, I am I. Is there a murderer here? No. Yes, I am. Then fly! What, from myself? Great reason. Why: Lest I revenge. Myself upon myself? Alack, I love myself. Wherefore? For any good That I myself have done unto myself? O no, alas, I rather hate myself For hateful deeds committed by myself. I am a villain.
King Johnにもある。
Madam, by chance but not by truth; what though? Something about, a little from the right, In at the window, or else o’er the hatch: Who dares not stir by day must walk by >night, And have is have, however men do catch: Near or far off, well won is still well shot, And I am I, howe’er I was begot.
あとは、オクスフォード大学の神学教授、Henry Scott Hollandによる「Death Is Nothing At All」にも
Everything remains exactly as it was. I am I, and you are you, and the old life that we lived so fondly together is untouched, unchanged. Whatever we were to each other, that we are still.
という用例が見られる。
まぁ、「Fラン」とバカにした人に教養がなかったというだけの話なんだけど、人を馬鹿にするのはやめようね。
Tahoeになってから、ウィンドウに切り替わりが遅い。具体的には、ブラウザからVSCodeに切り替える時に1秒くらい固まることがある。
これ、どうもElectronの問題らしい。少なくとも、GPUの利用率が100%近くなる問題があったらしい。しかし、迅速なバージョンアップにより修正されたはず。しかし、まだ重いな。
Electron製のアプリに影響するので、VS CodeやSlackなどが影響を受けるっぽい。うーむ。
普段使いのWindows PCのディスク容量が足りずに不具合がおき始めた。いろいろアプリをアンインストールしてもだめ。
わかった。仮想記憶領域vhdファイルが大きくなりすぎてるんだ。vhdを圧縮しても小さくならない。
急遽、異なるPCのセットアップに入る。うーん。
以下、メモ:
- Google Chrome インストール
- PowerShellで
wsl --install再起動 - Microsoft StoreでUbuntu 24.04をインストール
- Subversionのインストール
sudo apt update
sudo apt upgrade -y
sudo apt install -y subversion公開鍵を登録し、すぐにサーバからリポジトリを一括でcheckout。いまどきSubversion管理・・・と思わなくはないが、研究教育関連が全部一つのリポジトリに突っ込んであるので、こうして一括で復活できるのは楽だ。
- Microsoft 365をインストール。
- Adobe Readerをインストール(あまり入れたくないのだが)。
- VSCodeをインストール
- Git for Windowsをインストール
UbuntuとGit Bashの公開鍵をGitHubに登録。
GitHubでパスキーQRコードをスマホで撮影してもサポートされていないと表示される原因がわかった。スマホの写真アプリではダメで、Google Lensを使う必要があった。
とりあえず新しいWindows PCセットアップ完了。明日の講義に間に合った・・・
そして論文修正ができてない・・・
10月15日(水)
GitHub演習のレポート採点続き。まずは座学第一回が終わった。
研究室ミーティング。
GitHub演習のレポート採点続き。座学第二回も終わった。
論文査読対応まで手が回らない・・・
10月14日(火)
プログラミング基礎同演習第二回。
論文の査読返ってきた。Reject…orz
しかし、とても丁寧なレポートが返ってきたので、ちゃんと修正して別のところに出そう。
GitHub演習のレポート採点。
10月13日(月)
リモート作業中にうっかり、
sudo nmcli con down eno1
sudo nmcli con up eno1をやってしまって接続が切れたノード、物理ログインしてリブートしたら固定IPだけになった。そして、ypbindが走ってるので/homeでpermission denied。まず固定IPを指定してリブート、が最初の作業だな。
まずはNFSのマウント確認。
$ sudo mount -t nfs 192.168.1.20:/home /mnt/home_nfs
Created symlink /run/systemd/system/remote-fs.target.wants/rpc-statd.service → /usr/lib/systemd/system/rpc-statd.service.この状態で、
$ cd
-bash: cd: /home/watanabe: 許可がありません
$ cd /mnt/home_nfs/watanabe/
$ NISでアカウント共有しているので、/homeはpermission deniedだが、/mnt/home_nfs/watanabe/はちゃんと見れる。正しくNIS共有+NFSできてますね。よしよし。
sudo umount /mnt/home_nfs/
sudo mount -t nfs 192.168.1.20:/home /home
cd/home通った。dfで確認。
$ df | grep home
192.168.1.20:/home 46872928256 27035027456 19837900800 58% /homeよしよし。/etc/fstabを以下のように修正。
/dev/mapper/rl-root / xfs defaults 0 0
UUID=1a0defb8-f376-4254-8e56-3a9a9cbe949f /boot xfs defaults 0 0
UUID=DD5A-1F2D /boot/efi vfat umask=0077,shortname=winnt 0 2
#/dev/mapper/rl-home /home xfs defaults 0 0
/dev/mapper/rl-swap none swap defaults 0 0
192.168.1.20:/home /home nfs defaults,_netdev 0 0リブート。ここまでで、
- ホストベース認証
- NIS共有
- NFS
まで通った。
次、slurmのインストール(クライアント)。
/etc/selinux/configで
SELINUX=disabledにしてからreboot。
mungeのインストール
sudo dnf -y install mungeリブートしたら外に繋がらんくなった。なんでだよ・・・
yagami02のdefault gatewayが192.168.1.2なのに、yagami03が192.168.1.1になってた。コマンド履歴を見ると192.168.1.2を指定しているんだけどなぁ。
sudo ip route del default
sudo ip route add default via 192.168.1.2 dev eno1により通ったので、
sudo nmcli con mod eno1 ipv4.gateway "192.168.1.2"
sudo nmcli con up eno1で永続化。
あと、nameserverはNetworkManagerが自動生成するので、/etc/resolv.confを手で書いても上書きされてしまう。
sudo nmcli con mod eno1 ipv4.dns "1.1.1.1"
sudo systemctl restart NetworkManagerこれで/etc/resolv.confが修正されていることを確認。
改めてmungeのインストール。
ログインノードから計算ノードにmunge.keyのコピーをする必要があるが、/homeを共有しているのでそこを経由して。
sudo cp /etc/munge/munge.key .
sudo cp munge.key /etc/munge/
sudo chown munge:munge /etc/munge/munge.key追記:chownを忘れてた
sudo dnf install slurm slurm-slurmd mungeslurm.confにyagami03を追加。
ログインノードのslurm.confを/home経由でコピー。
sudo cp slurm.conf /etc/slurm/計算ノードは6818をあける必要がある。
sudo firewall-cmd --permanent --add-port=6818/tcp
sudo systemctl restart firewalld追記:firewallの再起動を忘れて、つながらなかった。
ディレクトリの作成と所有者の修正。
sudo mkdir -p /var/spool/slurm/d /var/log/slurm /var/run/slurm
sudo chown -R slurm:slurm /var/spool/slurm /var/log/slurm /var/run/slurm
sudo chmod 755 /var/spool/slurm /var/log/slurm /var/run/slurmmungeとslurmdを起動。自動起動も追加。
sudo systemctl start munge
sudo systemctl start slurmd
sudo systemctl enable --now munge
sudo systemctl enable --now slurmdログインノードで、slurmdctldの再起動。
sudo systemctl restart slurmctld
sudo scontrol reconfiguresinfoで確認。OK。
その後yagami03を再起動したらまた死んだ。
sudo systemctl enable --now munge
sudo systemctl enable --now slurmdを設定して自動起動をONにしていなかったのが原因。起動してからログインノードで以下を実行したら復活。
sudo scontrol update nodename=yagami03.appi.keio.ac.jp state=resume新たにyagami01をセットアップ。今度こそ手順完全版を作る。
USBでRockey Linux 9.6をインストール
/etc/hostsの内容をyagami02からコピー
ホスト名の設定。
sudo hostnamectl set-hostname yagami01これでhostnameとhostname -fが想定通りになることを確認。
固定IPをふり、かつDNSやDefault GWを設定。
sudo nmcli connection modify eno1 ipv4.addresses 192.168.1.11/24
sudo nmcli connection modify eno1 ipv4.gateway 192.168.1.2
sudo nmcli connection modify eno1 ipv4.dns "1.1.1.1"
sudo nmcli connection modify eno1 ipv4.method manual
sudo nmcli connection modify eno1 ipv6.method ignore
sudo nmcli connection up eno1を実行してから念のためreboot(NetworkManagerだけで良いかもしれないが、接続中だと変な設定が残ることがあるので)。
ホストベース認証。
まずはSELinuxを無効に。
sudo setenforce 0sudo vim /etc/selinux/configで、
SELINUX=disabledに。
ログインノード側で
ssh-keyscan -t ed25519 yagami01 | sudo tee -a /etc/ssh/ssh_known_hosts計算ノード側で、
ssh-keyscan -t ed25519 watanabe-login.appi.keio.ac.jp | sudo tee -a /etc/ssh/ssh_known_hosts/etc/ssh/shosts.equivを以下の内容に。
watanabe-login.appi.keio.ac.jp
yagami01
yagami02
yagami03
yagami04/etc/ssh/sshd_configを以下のように修正。
HostKey /etc/ssh/ssh_host_ed25519_key
IgnoreUserKnownHosts no
HostbasedAuthentication yes
UseDNS yes計算ノードに2222を開けてsshdを2222で起動。
sudo firewall-cmd --add-port=2222/tcp
sudo /usr/sbin/sshd -d -p 2222ログインノードから接続確認。
ssh -o PreferredAuthentications=hostbased yagami01 -p 2222接続できたら、計算ノードでsshdをrestart。
sudo systemctl restart sshdログインノードから通常ポートで接続。
ssh -o PreferredAuthentications=hostbased yagami01接続できたらホストベース認証完成。
次、NISの設定。
DNFのアップデート。
sudo dnf update -y別ノードで作った以下の3つのRPMをコピーしてインストール。
mkdir build
cd build
scp yagami03:build/*.rpm .
sudo dnf localinstall -y ~/build/ypbind-2.7.2-2.el9.x86_64.rpm ~/build/nss_nis-3.2-8.el9.x86_64.rpm ~/build/yp-tools-4.2.3-2.el9.x86_64.rpm/etc/yum.confに以下を追加。
exclude=ypbind nss_nis yp-tools authselect-libs autofssudo ypdomainname watanabe-group/etc/yp.confを以下のように修正。
domain watanabe-group server watanabe-loginypbind起動。
sudo systemctl start ypbind$ ypwhich
watanabe-login/etc/nsswitch.confをNISを先に見るように直接編集。
passwd: nis files sss systemd
group: nis files [SUCCESS=merge] sss [SUCCESS=merge] systemd
shadow: nis filesgetentが通ることを確認。
getent passwd 適当なユーザ名通った。
次、NFS。
sudo dnf install -y nfs-utils
sudo mkdir -p /mnt/home_nfs
sudo mount -t nfs 192.168.1.20:/home /mnt/home_nfsこれでマウントできることを確認。
sudo umount /mnt/home_nfs/etc/fstabを以下のように修正。
/dev/mapper/rl-root / xfs defaults 0 0
UUID=d35febed-3269-4ca5-b494-27d11a2d387f /boot xfs defaults 0 0
UUID=9032-A23D /boot/efi vfat umask=0077,shortname=winnt 0 2
#/dev/mapper/rl-home /home xfs defaults 0 0
/dev/mapper/rl-swap none swap defaults 0 0
192.168.1.20:/home /home nfs defaults,_netdev 0 0リブート。/home/が正しくマウントできた。
次、slurm。
mungeのインストール。
sudo dnf -y install munge既に/homeにmunge.keyがあるので共有。
sudo cp munge.key /etc/munge/
sudo chown munge:munge /etc/munge/munge.keySlurmのインストール。
sudo dnf groupinstall "Development Tools" -y
sudo dnf install -y epel-release
sudo dnf install -y slurm slurm-slurmdログインノードの/etc/slurm/slurm.confにyagami01を追加。
# COMPUTE NODES
NodeName=watanabe-login.appi.keio.ac.jp CPUs=20 State=UNKNOWN
NodeName=yagami01.appi.keio.ac.jp CPUs=20 State=UNKNOWN
NodeName=yagami02.appi.keio.ac.jp CPUs=20 State=UNKNOWN
NodeName=yagami03.appi.keio.ac.jp CPUs=20 State=UNKNOWN
PartitionName=main Nodes=ALL Default=YES MaxTime=1-00:00:00 State=UPログインノードで/homeにコピー。
sudo cp /etc/slurm/slurm.conf .計算ノードでローカルにコピー。
sudo cp slurm.conf /etc/slurm/6818をあける。
sudo firewall-cmd --permanent --add-port=6818/tcp
sudo systemctl restart firewalldslurmユーザの作成。
sudo groupadd -g 64030 slurm
sudo useradd -u 64030 -g slurm -m -d /var/lib/slurm -s /sbin/nologin -r slurmsudo mkdir -p /var/spool/slurm/d /var/log/slurm /var/run/slurm
sudo chown -R slurm:slurm /var/spool/slurm /var/log/slurm /var/run/slurm
sudo chmod 755 /var/spool/slurm /var/log/slurm /var/run/slurmmungeとslurmdを起動。
sudo systemctl enable --now munge
sudo systemctl enable --now slurmd
sudo systemctl start munge
sudo systemctl start slurmd計算ノードでslurmctldを再起動して再読み込み。
sudo systemctl restart slurmctld
sudo scontrol reconfigure計算ノードを認識した。
あとはすべての計算ノードで、
sudo dnf install -y openmpi openmpi-develとかやってから、/etc/bashrcに
export PATH=/usr/lib64/openmpi/bin:$PATHを追加しないとmpirunにパスが通らない。
export PATH=$PATH:/home/apps/lammps
mpirun -np 20 lmp < collision.input が全てのノードで通ることを確認。 終わったぞ〜!!!
もう一つの懸案だった、学科ウェブに学生さんの受賞情報を掲載するのもやった。
10月12日(日)
子どものスマホを契約。契約にすげー時間がかかった上、その後の設定にもすげー時間がかかって消耗・・・
疲れて今日はレポートの採点ができなかった・・・
10月11日(土)
会議とか。
プログラミング基礎同演習のレポート採点。すげー時間かかったな。
10月10日(金)
故障したサーバにRockeyを入れ直す。別の計算ノードでバージョン確認。
$ cat /etc/redhat-release
Rocky Linux release 9.6 (Blue Onyx)9.6ですね。
MacのターミナルからRockey Linux release 9.6のブータブルUSBを作ろうとしたが、ddを使ったりして危ないな。 ChatGPTにBalena Etcherというのを紹介されたが、ここは大人しくWindowsでRufasを使うか。
https://rufus.ie/ja/からRufasをダウンロード。
Rocky-9.6-x86_64-dvd.isoをダウンロード、しようとしたが、公式サイトからは重すぎる。
理研のミラーからダウンロード。
作業ログ。
USBブートして計算ノードにRockeyを再インストール。
rootパスワード指定
インストール終了後再起動。USBを抜く。
起動後、最初に自分のユーザアカウントを追加
自分をsudoersに追加
ホスト名の設定
$ hostnamectl Static hostname: (unset) Transient hostname: localhost Icon name: computer-server Chassis: server 🖳 Machine ID: 203813d2d4d548c5a2fa0799e8e79eaf Boot ID: ff05f843ffa64940916e346d133e6e97 Operating System: Rocky Linux 9.6 (Blue Onyx) CPE OS Name: cpe:/o:rocky:rocky:9::baseos Kernel: Linux 5.14.0-570.17.1.el9_6.x86_64 Architecture: x86-64 Hardware Vendor: Dell Inc. Hardware Model: PowerEdge R640 Firmware Version: 2.8.1 $ sudo hostnamectl set-hostname yagami03 $ hostnamectl Static hostname: yagami03 Icon name: computer-server Chassis: server 🖳 Machine ID: 203813d2d4d548c5a2fa0799e8e79eaf Boot ID: ff05f843ffa64940916e346d133e6e97 Operating System: Rocky Linux 9.6 (Blue Onyx) CPE OS Name: cpe:/o:rocky:rocky:9::baseos Kernel: Linux 5.14.0-570.17.1.el9_6.x86_64 Architecture: x86-64 Hardware Vendor: Dell Inc. Hardware Model: PowerEdge R640 Firmware Version: 2.8.1hostnamectlで現状確認、hostnamectl set-hostnameで名前設定。ネットワークを固定IPに。
nmcli connection showで現状確認。
$ nmcli connection show NAME UUID TYPE DEVICE eno1 97a43ef0-4f9d-39ba-b999-8213ca8b2f38 ethernet eno1 lo 9e831b82-81ee-4317-b89e-1faf308b3e3b loopback lo eno2 ae6e89b9-e5aa-462e-b45f-dcf149d13056 ethernet -- eno3 46292068-2837-4836-916d-9b4477bf5b68 ethernet -- eno4 fc161a70-08b3-4f82-ab17-d2f854f084b6 ethernet --- DEVICEに出てきたのでeno1で接続していることがわかる。
- eno1に192.168.1.13を設定(192.168.1.12を参考に)
sudo nmcli connection modify eno1 ipv4.addresses 192.168.1.13/24 sudo nmcli connection modify eno1 ipv4.gateway 192.168.1.2 sudo nmcli connection modify eno1 ipv4.dns "1.1.1.1" sudo nmcli connection modify eno1 ipv4.method manual sudo nmcli connection modify eno1 ipv6.method ignore- ネットワーク再起動
sudo systemctl restart NetworkManager- 別窓から新しいIPで接続して成功したことを確認。
NISのインストールをソースから
- Gitのインストール
sudo dnf update -y sudo dnf install -y git- ここの通りに実行
mkdir build cd build git clone https://github.com/thkukuk/ypbind-mt cd ypbind-mt git checkout v2.7.2 cd .. tar --exclude-vcs --transform 's/ypbind-mt/ypbind-mt-2.7.2/' -cvzf ypbind-mt-2.7.2.tar.gz ypbind-mtこれで
ypbind-mt-2.7.2.tar.gzが作られる。- ypbindの作成
curl -O http://dl.rockylinux.org/pub/rocky/8/AppStream/source/tree/Packages/y/ypbind-2.5-2.el8.src.rpm rpm -Uvh ypbind-2.5-2.el8.src.rpm vi ~/rpmbuild/SPECS/ypbind.spec # ブログ記事を参考に修正dnf --enablerepo=devel install -y dbus-glib-devel libnsl2-devel libtirpc-devel systemd-devel cd build cp ypbind-mt-2.7.2.tar.gz ~/rpmbuild/SOURCES/ sudo dnf install -y rpm-build sudo dnf install -y autoconf automake gettext-devel docbook-style-xsl sudo dnf groupinstall -y "Development Tools" rpmbuild -bb ~/rpmbuild/SPECS/ypbind.spec- nss_nis
cd cd build git clone https://github.com/thkukuk/libnss_nis cd libnss_nis git checkout v3.2 cd .. tar --exclude-vcs --transform 's/libnss_nis/libnss_nis-3.2/' -cvzf libnss_nis-3.2.tar.gz libnss_nisibnss_nis-3.2.tar.gzができる。
- rpm作成
curl -O http://dl.rockylinux.org/pub/rocky/8/BaseOS/source/tree/Packages/n/nss_nis-3.0-8.el8.src.rpm rpm -Uvh nss_nis-3.0-8.el8.src.rpm vi ~/rpmbuild/SPECS/nss_nis.spec # ブログ記事を参考に修正 cp libnss_nis-3.2.tar.gz ~/rpmbuild/SOURCES/ rpmbuild -bb ~/rpmbuild/SPECS/nss_nis.specできたかどうか確認。
$ ls ~/rpmbuild/RPMS/x86_64/nss_nis-* /home/watanabe/rpmbuild/RPMS/x86_64/nss_nis-3.2-8.el9.x86_64.rpm /home/watanabe/rpmbuild/RPMS/x86_64/nss_nis-debuginfo-3.2-8.el9.x86_64.rpm /home/watanabe/rpmbuild/RPMS/x86_64/nss_nis-debugsource-3.2-8.el9.x86_64.rpm- yp-tools
cd cd build curl -O http://dl.rockylinux.org/pub/rocky/8/AppStream/source/tree/Packages/y/yp-tools-4.2.3-2.el8.src.rpm rpmbuild --rebuild yp-tools-4.2.3-2.el8.src.rpmできたかどうか確認
$ ls ~/rpmbuild/RPMS/x86_64/yp-tools-* /home/watanabe/rpmbuild/RPMS/x86_64/yp-tools-4.2.3-2.el9.x86_64.rpm /home/watanabe/rpmbuild/RPMS/x86_64/yp-tools-debuginfo-4.2.3-2.el9.x86_64.rpm /home/watanabe/rpmbuild/RPMS/x86_64/yp-tools-debugsource-4.2.3-2.el9.x86_64.rpm- できたRPMのインストール。
sudo dnf localinstall -y ~/rpmbuild/RPMS/x86_64/ypbind-2.7.2-2.el9.x86_64.rpm ~/rpmbuild/RPMS/x86_64/nss_nis-3.2-8.el9.x86_64.rpm ~/rpmbuild/RPMS/x86_64/yp-tools-4.2.3-2.el9.x86_64.rpm- /etc/yum.confに以下を追加。
exclude=ypbind nss_nis yp-tools authselect-libs autofs- ypbind起動。
sudo systemctl enable ypbind --now失敗。
rpcinfo -p NISサーバ名が通らない。/etc/hostsをyagami02と同じものに書き換えたら、通った。- ypdomainnameをwatanabe-groupに
sudo ypdomainname watanabe-group- /etc/yp.confを以下のように修正。
domain watanabe-group server watanabe-login- 動作確認
sudo systemctl start ypbind ypwhichypwhichまでは通るがgetnetできない。
/etc/nsswitch.confをNISを先に見るように直接編集(あまりよくないが)
passwd: nis files sss systemd group: nis files [SUCCESS=merge] sss [SUCCESS=merge] systemd shadow: nis filesgetentが通ることを確認。
ホストベース認証
- サーバ側で
ssh-keyscan -t ed25519 yagami03 | sudo tee -a /etc/ssh/ssh_known_hosts- クライアント側で
ssh-keyscan -t ed25519 watanabe-login.appi.keio.ac.jp | sudo tee -a /etc/ssh/ssh_known_hosts/etc/ssh/sshd_configで
HostKey /etc/ssh/ssh_host_ed25519_key IgnoreUserKnownHosts no HostbasedAuthentication yes UseDNS yesにする。 その上で、
/etc/ssh/shosts.equivにホストベース認証したいホストをずらずら書く(今回これを忘れていた)。ホスト側(計算ノード)で
sudo firewall-cmd --add-port=2222/tcp sudo /usr/sbin/sshd -d -p 2222クライアント側(ログインノード)で
ssh -o PreferredAuthentications=hostbased yagami03を実行し、通ればOK。sshdをrestart。
疲れたなぁ。
yagai03にNFSのインストール。
sudo dnf install -y nfs-utils
cd /mnt
sudo mkdir home_nfs失敗する。firewall?
sudo firewall-cmd --permanent --add-service=nfs
sudo firewall-cmd --permanent --add-service=rpc-bind
sudo firewall-cmd --permanent --add-service=mountd
sudo firewall-cmd --reloadChatGPTの言う通りに作業してて、
sudo nmcli con down eno1
sudo nmcli con up eno1を叩いてしまい、ネットワーク接続が切れてリモートから作業ができなくなってしまった。アホすぎる。
10月09日(木)
サーバ設定。Rockeyで
sudo dnf update -yとすると
Error:
Problem 1: package authselect-1.2.6-3.el9.x86_64 from baseos requires authselect-libs(x86-64) = 1.2.6-3.el9, but none of the providers can be installed
- cannot install the best update candidate for package authselect-1.2.6-2.el9.x86_64
- package authselect-libs-1.2.6-3.el9.x86_64 from baseos is filtered out by exclude filtering
Problem 2: package authselect-compat-1.2.6-3.el9.x86_64 from appstream requires authselect(x86-64) = 1.2.6-3.el9, but none of the providers can be installed
- package authselect-1.2.6-3.el9.x86_64 from baseos requires authselect-libs(x86-64) = 1.2.6-3.el9, but none of the providers can be installed
- cannot install the best update candidate for package authselect-compat-1.2.6-2.el9.x86_64
- package authselect-libs-1.2.6-3.el9.x86_64 from baseos is filtered out by exclude filtering
(try to add '--skip-broken' to skip uninstallable packages or '--nobest' to use not only best candidate packages)のようなエラーがでる。これは、/etc/dnf/dnf.confに
exclude=ypbind nss_nis yp-tools authselect-libs autofsと、authselect-libの除外設定があるから。
Rockeyにslurmインストール。最初にソースからインストールしてしまったので話がややこしくなった。素直にdnfを使うべき。
ログインノードでのジョブ投入は成功。計算ノードからつながらない。
$ nc -zv login-node-name 6817
Ncat: Version 7.92 ( https://nmap.org/ncat )
Ncat: No route to host.ポートが塞がってますね。ログインノードで以下を実行。
sudo firewall-cmd --zone=public --add-port=6817/tcp --permanent
sudo firewall-cmd --zone=public --add-port=6818/tcp --permanent
sudo firewall-cmd --reload計算ノードは6818をあける必要がある。
sudo firewall-cmd --permanent --add-port=6818/tcp
sudo systemctl restart firewalld通った(firewalldを再起動忘れて繋がらなかった・・・)。
次はMPI。計算ノードで以下を実行。
sudo dnf install -y openmpi openmpi-develパスを通す。/etc/bashrcに以下を追加。
export PATH=/usr/lib64/openmpi/bin:$PATHPartitionName=default Nodes=ALL Default=YES MaxTime=INFINITE State=UPとしたらエラー。defaultは予約後だそうで。
PartitionName=main Nodes=ALL Default=YES MaxTime=INFINITE State=UPとしたら通った。
PartitionName=main Nodes=ALL Default=YES MaxTime=1-00:00:00 State=UPと、24時間制限をつけた。
クラスタにlammpsインストール
cd github
git clone -b release --depth 1 https://github.com/lammps/lammps.git
cd lammps
mkdir build
cd build
cmake ../cmake \
-D CMAKE_C_COMPILER=mpicc \
-D CMAKE_CXX_COMPILER=mpicxx \
-D CMAKE_INSTALL_PREFIX=~/usr/local \
-D CMAKE_CXX_FLAGS="-O3 -std=c++11 -fopenmp" \
-D BUILD_MPI=yes \
-D BUILD_OMP=yes \
-D CMAKE_EXE_LINKER_FLAGS="-O3 -std=c++11 -fopenmp" \
-D PKG_MOLECULE=on
make -j 4
make install無事にログインノード、計算ノードでlammpsも並列に走った。よし。これで研究室クラスター復活。
・・・疲れたなぁ。
10月08日(水)
会議。
来年度に向けて、博士号取得のスケジュール確認をするなどした。
デロイトがオーストラリア連邦政府から受託した報告書をAIを使って書いたのがバレて返金
存在しない参考文献でバレたとのこと。デロイトは「報告内容には変更はない」と言っているけれど、「主要な部分もAIで書いたのでは?」と思われるよね・・・
研究室ミーティング。シアシックニングと格闘ゲームの強化学習。今日から本格的に英語での発表です。
NIS共有の設定続き。うまくNIS共有できなかったのはサーバ側のポートが閉じていたから。
サーバ側で
sudo firewall-cmd --permanent --add-port=861/tcp
sudo firewall-cmd --permanent --add-port=861/udp
sudo firewall-cmd --permanent --add-port=111/tcp
sudo firewall-cmd --permanent --add-port=111/udp
sudo firewall-cmd --reloadを実行することでポートが通った。
クライアント側で
sudo /usr/sbin/ypbind -dを実行することでどこでこけているかがわかる。ypwhichやgetentが通るようになった時点で
sudo systemctl start ypbindで通った。
クライアントでypbindが自動起動するか確認。
$ sudo systemctl is-enabled ypbind
enabled大丈夫ですね。
Slurmのインストール途中で時間切れ。
ノーベル化学賞が日本人受賞でバタバタ・・・
10月07日(火)
田園都市線、昨日の深夜に復旧。今日は普通につかえてよかった。
夜は物理学会のノーベル賞対応でバタバタ。
10月06日(月)
昨夜、田園都市線が脱線事故を起こし、最寄り駅が全く動かなくなってしまった。 しばらくしたら復活するかと思ったが、全く復活しなかったので、息子は別の経路で登校。僕は在宅勤務に。
ちょっと接触しただけらしいので、すぐ復旧すると思っていたが、まさか今日一日ずっと不通だとは思わなかった。
息子が帰れないので、車で学校まで迎えにいった。
計算科学春の学校の飛行機とかホテルとかの予約した。こういうの疲れるな。
10月05日(日)
NOP
NOPといいつつ、なんか毎週土日に車での子供の送り迎えがあるから相当疲れる・・・
10月04日(土)
NOP
10月03日(金)
1on1とか。
GitHub演習のガイダンスの準備でバタバタした。アナウンスには正しいURLを書いたが、モジュールのページのZoomのURLが古いままだった。 来年は気をつけないと。
ガイダンスに引き続き、今年から生成AIとの付き合い方のガイダンスも追加。
出張申請がボロボロだった。事務の方にいろいろご迷惑をおかけした。大変申し訳ありません。後で修正されたバージョンを確認して、来年から気をつけます。
査読返した。
研究室のジョブスケジューラ確認。Rocky+OpenPBSではトラブルが多いらしい。Slurmだとすぐ入るっぽい。試さないと(いつ?)。
10月02日(木)
講義動画が全てBoxだったのを、K-LMSのVideoにすべて修正した。相当時間かかった。
あと、プログラミング基礎同演習の動画内の回数が間違っているな。確か、コロナの時に講義回数が一回減って、その後追加したからズレたんだな。
講義のガイダンス用の「生成AIとの付き合い方」のスライド最終調整。完成したことにする。GitHub演習とプログラミング基礎同演習で使う予定。
山本さんが日本生物物理学会学生発表賞を受賞。おめでとうございます!
研究室ミーティング。やっぱり英語でやるの結構大変だな。
出版社からの問い合わせを返した。
10月01日(水)
10月になってしまった。毎月これ書いてない?
GitHub演習の班分け表忘れてた。慌てて作る。
昨日注文した留学生用PCが今日届いた。素晴らしい。早速留学生さんと一緒にセットアップ。
プログラミング基礎同演習とGitHub演習のアナウンス投げた。
明日の発表スライド作った。
講義のガイダンス用の「生成AIとの付き合い方」のスライド生成した。
秋学期の講義が始まるのでバタバタする。