宋本廣韻の音韻データをAIエージェントで整備する
May 26, 2026
公開データ(sbgy.xml・廣韻.csv)を使い、AIエージェントへの日本語指示だけで廣韻の音韻統合 JSON 辞書を自律的に生成する手順を解説します。さらに研究者が自作した手元データを加えて照合精度を高めるための5つの要件を具体例とともに示します。
公開データ(sbgy.xml・廣韻.csv)を使い、AIエージェントへの日本語指示だけで廣韻の音韻統合 JSON 辞書を自律的に生成する手順を解説します。さらに研究者が自作した手元データを加えて照合精度を高めるための5つの要件を具体例とともに示します。
漢字データベースプロジェクトで公開されている「宋本廣韻データ」の入手方法から、GitHubからのデータダウンロード、形成AI(Claude)を活用してXMLデータをPythonスクリプトで解析し、研究に便利なJSON形式の辞書データへと一気に構造化する実践的な手順を紹介します。
HugoサイトをGitHub Pagesで公開する際、従来は以下の手順で手動運用していた。
hugo コマンドを実行して docs/ を生成docs/ を git commitこの運用をGitHub Actionsによる自動ビルド・自動デプロイに移行したので、その手順とトラブルシューティングをまとめる。
...いろいろな形式がある。
1の形式のものをチェックして2に修正。
...VS Codeで次の Mermaidで作図したER図は表示されるが、Hugo の book では図が描けない。 どうしたら表示できるか。
...Glossary for the Myōgishō Database English Translation
目的: この用語集は、名義抄データベースの英語版作成および利用にあたり、日本語の専門用語とその英語訳、および定義を明確にし、一貫性を確保することを目的とします。このデータベースでは、名義抄の本文に関連する解説情報を包括的に「Commentary」として提供しており、その中で名義抄原典の注釈とデータベース作成者による注釈が区別されています。
...config.toml)
#defaultContentLanguage = "ja"
defaultContentLanguageInSubdir = true
[languages]
[languages.ja]
languageName = "Japanese"
weight = 1
[languages.en]
languageName = "English"
weight = 2
defaultContentLanguageInSubdir = true にすることで、デフォルト言語(日本語)も /ja/ サブディレクトリに配置され、明示的な切替が可能になります。content/ フォルダ内に _index.ja.md と _index.en.md を用意。.md ファイルを準備すると .Translations が有効に機能します。例:
...コードブロックの背景色と文字色を、図や全体の配色と調和するように変更する。
custom.css の作成と設置
#パス: static/css/custom.css
内容(例):
...平安時代漢字字書総合データベース(HDIC)は 2014年にスタートしたが、代表者の 退職に伴い、公開方法の見直しが必要となった。
また、収録した古辞書の翻刻の凡例が 簡略であったり、準備できていないものも あった。
...