見出し画像

住所検索開発者が教える、知っておきたい日本の住所の話(第3回)

こんにちは。見習いスパルタ人1号です。ナビタイムジャパンで地点検索基盤の開発を担当しています。

第1回では住居表示法について、第2回では地番住所について解説しました。第3回となる今回は地番住所のコーナーケースについて解説するとともに「計算機で扱う日本の住所」の総説を行います。

前回から時間が空いてしまい申し訳ないですが、今回の内容は前回までの内容を前提としている箇所がありますので、復習がてらお読みいただくとすんなり理解できるかと思います。

ヘッダ画像から察した方もいらっしゃるかと思いますが、今回は京都の通り名住所についても解説します。

丁目がある≠住居番号がある

ここまで住所の基本ルールを解説してきましたので、ここからは基本ルールから外れる住所について解説したいと思います。まずは陸上自衛隊 武山駐屯地を見てみましょう。

住居表示実施済みの区画に所在する国有施設の住所は無番地となりません。たとえば武山駐屯地の住所は「神奈川県横須賀市御幸浜1-1」となっています。

「あれ、丁目がないのに住所表示?」と思った方。良い着眼点です。実は丁目の有無は住居表示とは無関係なのです。

横須賀市は各町名について住居表示の有無をまとめてくれていますが、御幸浜はしっかりと「住居表示済み」となっています。その一方で、たとえば横須賀市追浜東町は丁目があるのに住居表示未実施です。たとえば、横須賀市立浦郷小学校の住所=地番は「横須賀市追浜東町2丁目14」となっています。

前回の記事を読んだことで、丁目のある住所では必ず住居番号が振られている、という仕様を作ろうと思った方はご注意ください。住居番号がない場合もあります。

番地≠数字である

多くの住所では番地は数字となっています。1977年に制定された不動産登記事務取扱手続準則67条にて、数字を用いることが指定されているためです。

しかし1977年以前に地番が確定した箇所についてはその限りではありません。代表的な例として、石川県金沢市にある医王山スポーツセンターを見てみましょう。

住所をご覧ください。「石川県金沢市田島町よ27甲」となっています。構造としては石川県(都道府県) 金沢市(市区町村) 田島町(大字) よ(小字) 27甲(地番)です。

田島町の住所一覧を見てみましょう。小字に「ウ」などの一文字がついていますね。こういったケースは石川県に多く見られますが、レファレンス協同データベースに詳細が記載されていますので経緯が気になる方はご一読ください。

第1回に登場した「大阪市 中央区 久太郎町 4丁目渡辺」でも十分理解されたかと思いますが、日本の住所を階層ごとに処理しようとした場合、数字が入ってくることを前提にできる箇所はほとんどないことがおわかりかと思います。

地番住所は不便

ここまで見てきた通り、地番住所は不便です。付番のルールが全国まちまちですし、「無番地」すら存在します。そのため、日本において住所から目的地を探すことができないのはある意味で当然とも言えます。かといって、住居表示が全ての欠点を補っているわけでもないというのが難しいところですが……

そのため、場所を示す符号は利用者によって独自の体系が構築される場合もあります。まずは最も知名度が高いであろう符号体系である郵便番号について述べていきます。

郵便番号と住所は紐付かない場合がある

少し前に防府北基地と防府南基地について「どちらも無番地だが郵便局にはその辺りをよしなにするシステムがある」と書きました。それが事業所の個別郵便番号です。試しに日本郵便のサイトで「自衛隊」と検索してみましょう。

防府北基地と防府南基地は両方とも住所としては「山口県 防府市 大字田島 無番地」ですが、郵便番号を分けることで郵便局としては識別できるという仕組みになっています。

画像1

事業所郵便番号とは別の仕組みですが、ビルの階層で郵便番号が分けられている場合もあります。有名な例ではサンシャイン60が挙げられます。

サンシャイン60の1階は170-6001、30階は170-6030、60階は170-6060と、170-60XXが各階層に割り当てられています。このように、「住所としては同一だけど郵便はしっかり振り分けたい」ニーズがある時には特別な郵便番号が発生します。

そのため、「郵便番号は住所と1:1に対応する」という前提でシステムを組んでいると不具合を生み出すことがあります。

逆に、1つの郵便番号が複数の自治体を示すケースもあります。たとえば498-0000の領域は愛知県と三重県に跨がっています。ややこしいですね。

京都の通り名住所も独自体系

京都では通り名で場所を示すことがありますが、通り名は地番に関係ないため、独自の体系と言えるでしょう。たとえば阪急京都線 烏丸駅の目の前にある東急ハンズ京都店の住所は「京都府 京都市 下京区 四条通烏丸東入 長刀鉾町 27番地」となっています。

京都市は政令指定都市としては珍しく住居表示を一切行っていません。そのため、東急ハンズ京都店の入っている大丸京都店の地番は「京都府 京都市 下京区 長刀鉾町 27」となるはずです。

では、なぜ地番に関係がない「四条通烏丸東入」が入るのでしょうか?

有名な話ですが、京都の通り名住所は動き方の指定です。「四条通烏丸東入」というのは「四条通りと烏丸通りの交差点を東に行ったところ」という意味になります。図にすると以下のようになります。

画像3

※ 交差点名としては「四条烏丸」ですが、図では住所としての使われ方を記載しています

昔から使われているというのもあるのでしょうが、道案内という視点では面である「町」よりも線である「道」の方が分かりやすいですね。筆者は京都で暮らした経験はないのですが、この法則を覚えてから京都に観光で行ったところ、ナビなしで歩くぶんには非常に分かりやすく感動した覚えがあります。

また、歴史的な事情からか、京都には同名の町が多いことも通り名表記の合理性に一役買っています。たとえば上京区では今出川町が複数存在しており、今出川通沿いなのか元誓願寺通沿いなのか示す必要があります。

通り名住所については実感の上でも人間が使うぶんには便利で良いのですが、日本の住所はほとんどが「点」を示す関係上、住所検索システム上では「地先」と同じく扱いが難しいところです。

大分のローカル住所、組

京都以外にも独自の体系で構成された住所は存在しています。代表例として、大分県の「組」を紹介したいと思います。臼杵市の中心部を見てみましょう。「洲崎一丁目2組」のような文字列が見て取れるかと思います。

たとえば、臼杵市のとある温泉宿は住所として「臼杵市深田中対田11組」を表示しています。

大分県の「組」についても、臼杵市が解説を出しています。

2.「行政区」とは何でしょうか?
「行政運営上の地区分類」のことであり、学校区や選挙区などの行政区分として活用しているものです。
各家庭単位で任意に所属する、いわゆる自治会の区分と同一表記であり、転居などの住民異動届の際に正式住所と併せてお伺いしています。

とある通り、大分県の一部では自治会の区分を住所として慣例的に利用しているのです。入力値として許容するかはサービスの性格にもよりますが、テストパターンとして頭に入れておくと良いでしょう。

森林計画を用いた体系

ちょっと特殊な例では、森林計画を用いた体系が住所として使われる場合があります。草津温泉スキー場が良い例です。

草津温泉スキー場の住所は「群馬県 吾妻郡 草津町 大字草津 字白根 国有林158林班」となっています。「林班」という見慣れない文字列がありますね。これは森林計画における単位で、林野庁のサイトに解説があります。

森林の区画の単位で、都道府県が作成する地域森林計画の森林計画図において定められます。
行政上の字界、尾根や川などの天然地形又は道路などの地物をもって区画して設定されています。市町村ごと(又は一定地域ごと)に一連の番号が付けられており、森林計画図でその区域を確認することができます。

森林計画を基準にした住所表示は国有林内部でよく見られます。自衛隊の施設などと同様、国有であるため無番地なのでしょう。だからといって「国有林無番地」では広すぎるので、致し方なく森林計画を住所として代用しているのだと推測しています。

北海道の住所は正式な体系

独自体系の住所が乱立する一方で、一見すると特殊な構造に見える北海道の住所は明治以降に開拓されたからか、正式に地番や住居表示と紐付いています。たとえば札幌市は創成川と大通りの交点を起点として、大通りに並行する道路を「南/北○条」、創成川に並行する道路を「東/西△丁目」として、挟まれた領域を「南/北○条 東/西△丁目」としています。図にすると以下のようになります。

画像4

大通と創成川の交点はさっぽろテレビ塔とほぼ一致しているため、札幌中心部を移動する際はテレビ塔を原点とすると移動しやすくなります。

たとえばサッポロビール園の住所は「札幌市 東区 北7条東9丁目 2-10」となっていますが、テレビ塔から北に7本大きな道を行き、東に9本大きな道を行けば理屈の上では着けるというわけですね。(とはいえ、この場合は公共交通機関を使う方が迷わないでしょう。バス時刻表も当社サイトからご覧になれます)

札幌以外でも、明治期に開拓された都市部では線路などを起点として似たような住所が振られている例が多く見られます。一方で北広島市など、昭和以降に都市化が進んだ土地では明治期の北海道式住所と昭和以降の住居表示が混在しているような箇所もあり、必ずしも統一感があるわけではありません。

まとめ: 住所は簡単に処理できない

画像2

これまで長々と書いてきましたが、何か簡単なロジックで日本の住所をいい感じに処理できる、という夢は叶いそうにありません。「何か一つの正規表現でよしなに処理できる」ということはありえません。

包括的な規則が存在せず、各地域ごとの事情が複雑に絡み合った結果、日本の住所は「大枠では一定に見えるが細かい部分では全くバラバラ」という状態になっています。

本稿では仕組みレベルでのバラツキについて多くを述べてきましたが、「ケ」「ヶ」「が」の表記ゆれや「通り」「通」の表記ゆれといった部分も日本の住所を処理する上で大きな課題です。正規化しようとしたら「つがる市」まで処理されてしまい悲しい思いをした、なんてこともあります。

このように現実が複雑な以上、検索基盤では日々地道な努力を進めています。皆様も住所を計算機で取り扱う際には十分気をつけていただければ幸いです。

一例ではありますが、住所データを計算機で扱うにあたってつまづきやすいポイントを表でまとめることで長きにわたる連載の締めとさせていただきます。