法令APIハッカソンに参加してみた。

2023年11月20日 18:05

参加してみて

白矩(しらく)では、「Archi-Law」という建築に関する法文検索サービスをリリースしており、良い機会なので参加してみました。
参加者の方々のサービスは発想が非常にユニークで、かつ、短い時間にも関わらずとてもクオリティの高いものを開発・実装されていました。発表の仕方も上手く、それだけでも色々と参考になりました。
弊社は建設業の立場から法令をどう扱いやすくするかという見方をしていましたが、いろいろな立場のチームが、法令をどう提供するといいのか？どんなことが課題としてあるのか？等参考になりました。
弊社はArchi-Lawのデータベースをどのように構築していくか？を目的として参加したので、アウトプットが少々弱くなったのですが、法令APIについてどう使えばよさそうかを考えることができ、とても良い経験ができました。
簡単にですが以下情報共有です。
※こちらで作品紹介掲載されています。

法令APIハッカソンとは？

「法令等データの利活用による産業・技術・政策立案の発達等を目的として」デジタル庁が主催したイベントです。ハッカソンとは、アプリやシステムの開発を担当するエンジニア、デザイナー、プログラマーなどが集まり、集中的に開発を行うイベントのことを言います。
デジタル庁から法令APIプロトタイプが期間限定で提供され、これを元に各チームがサービスのアイデアを考え、6日間でかたちにしたものを発表するというものです。

法令APIとは

簡単に説明しますと、法令APIとは「日本の法律や法令に関する情報をデジタル形式で提供するサービスまたはシステム」です。法を使ったサービスを提供する際には膨大な法文が必要となります。「○○の日に施行された法文だけ取り出したい」「ある分野に関する法文だけを取り出したい」など、その都度必要な法文をサーバーにアクセスして自動的に取り出せるようになる仕組みということです。
法令APIプロトタイプは「2023年10月24日（火）から2023年11月30日（木）」までだそうです。
現行のAPIもこちらで提供されています。

建築×カルテ

白矩の発表内容は、建築にも医療分野の電子カルテ（患者の医療記録）のような「建築物の「健康状態」を追跡し、維持管理するためのソフトウェアサービス」を作りたいというものでした。そしてそれを実現するために核となるものが建築物と関連法文の紐づけであり、今回は法令APIを使ってそれらを模索しました。

背景

以下の2つを解消できると建設業にとって良いのではないかと考えました。

・審査機関や消防署、役所等で協議した法の解釈についての具体的なやり取りの履歴や理由が整理されて残ることはほぼないため、竣工後に第三者が当時の法解釈を探りたい場合の労力が多大になる。
・建築プロジェクトにおける適合法文を調べるのに多大な労力がかかる。

デジタルコミュニケーションツールを通じて審査機関とやりとりした内容をカルテに貯める

利用技術・アーキテクチャ概要

ほとんどのチームが法令APIからデータを取得し、その後OpenAI（ChatGPTのAPI）を使用してファインチューニング(法令を理解できるように調整)を行っていました。ただしこの場合、なぜその法が適用されるのか？というプロセスがブラックボックスになってしまい確認が難しくなります。
そのため、違うアプローチが出来ないだろうかと考え、法令APIから取得したあと、グラフデータベースを構築する手法として機械学習を使用することにしました。これがめちゃめちゃ手間で、「クラスタリングするモデル」「文脈を読みエッジを繋ぐモデル」「法文を分解するモデル」…と多くの学習モデルが必要となり、全く実装が進みませんでした(笑)もっとざっくりやってもよかったなと反省です。
エンコードと呼ばれる学習するための時間が想像以上に膨らんでしまい、かつてのCGレンダリングのように時間がかかるので、計算リソースを考えてデータを上手く用意しないと難しい印象でした。

**データのクレンジング**
漢数字の変換や不要な記号、スペースの削除などデータの整形が思っていたより手間だった

**文脈(BERT)によるエッジの追加**
「及び」「その他」等の頻出するがそれほど重要ではない単語に引き摺られる等あり制御が大変

**GNNによるレコメンド**
これらをOpenAIで整形したかったが時間が足りず

社会に与える影響

建築プロジェクトは反省する機会や、他物件との比較が難しく、基本的には各プロジェクトが当事者以外にはブラックボックスとなっています。
デジタルだけでその全てを明らかにはできませんが、APIによる効率化と、「建築カルテ」が揃うことで、増改築時に設計者や審査機関が、そのカルテを参照して、どのような解釈によってこの建物が造られたのかを把握して設計に臨めたり、不動産や投資家が建物を取得してから素早く、その建物がもつ法的なリスクや現状について把握できるようになるというメリットが期待でき、プロジェクト途中や完成後の法的なトラブルを減らすことが出来ると考えています。
また、これまでにアナログな方法のみで対応されてきた、建築の法規に関わる様々な職種の生産性が大きく上がると期待できます。ただし、運用条件としては、このシステムを使って設計された建物でなければいけない点と、多数の方が利用しなければメリットがなかなか生きにくい点があります。

まとめ

法令APIハッカソンに参加したことで、法文と機械学習の関係やArchi-Lawの今後を考えるきっかけになりました。今回の経験を元に実務的な課題により解像度を上げて取り組んで行けそうです。

・SHIRAKU Inc-会社概要
・仕事のご依頼
・建築Tシャツ
・Rhinoceros8-購入