Geoloniaの新サービス「クイック住所変換」が住所データを効率的に正規化

プロジェクトオーガナイザの吉田聖書よしだみふみです。

8月16日に、位置情報関連のソリューションを提供している株式会社Geoloniaがプレスリリースを出しまして、住所を正規化するサービス「クイック住所変換」の提供を開始したと発表しました。

Geolonia、クイック住所正規化+緯度経度追加サービス「クイック住所変換」の提供開始(2023/8/16 株式会社Geolonia)

これは何かというと、例えば手書きや手入力で集めた顧客リストような、表記ゆれしている住所データを含むExcel形式のファイルをアップロードすると、住所の正規化と、オプションとして緯度経度情報の付与を行ったデータをダウンロードできるというサービスです。

なぜこのようなサービスが必要なのかというと、以前このブログでも取り上げましたが、住所って同じ場所を指していても人によって違う書き方ができてしまいます。そういう住所を人間が見ると同じ住所だと認識できるのに対して、コンピュータでは別々のデータだと認識してしまうということが起こります。しかもそれを人手をかけて補正しようとするとかなりの労力がかかります。これまでにも名寄せのソリューションというのは存在しましたが、それをもっと安くもっと手軽に提供しようということのようです。

この会社は自社で独自の住所データベースを整備しているようでして、その元データとしてデジタル庁、法務省、国土交通省が管理しているデータベースを参照しているようです。その豊富なデータ量と、それらのデータの政府によるメンテナンスに追随していく取り組みによって約98%の精度を実現しているようです。正規化と言っても「どの表記に合わせるのか」というのが疑問だったのですが、そういう国土交通省の位置参照情報に記載している表記に合わせているのだそうです。

丁目はすべて漢数字、番や号の数字はアラビア数字に修正され、アラビア数字とアルファベットはすべて半角文字に修正されます。他に修正される情報としては、漢字の字体の揺らぎ、ひらがな・カタカナの揺らぎがあります。例えば、市区町村名に含まれる市ヶ谷の「ケ」、夢の島の「の」、四ツ谷の「ツ」などがありますね。それから、削除される情報としては、京都の通り名、大字~。また、補完される情報としては、都道府県、~郡があります。

しかも、アップロードした住所データは、都道府県、市区町村、丁目までの地名、それ以降の住所という4つに分割してアウトプットされるようです。もし正規化できなかった場合、例えば架空の住所とか全くでたらめなデータという可能性もありますよね。そういう場合はエラー情報を記載して返してくれるようです。これは便利ですね。


※ この記事は、先日公開した以下の音声コンテンツを基に編集したものです。


以前、とある通販サイトを利用した時に、購入してからしばらくして郵便でDMが来るようになったんですよ。しかも、もう1回利用したら、同じタイミングで同じDMが2通ずつ届くようになったんですよ。あ、これ名寄せしてないんだなっていうのがバレバレでしたね。それほど大きな会社ではないので、顧客データベースにそこまでの機能が備わっていなかったんだろうと思いますが、2通以上のDMって無駄なコストですよね。

名寄せをするにしても住所の表記の揺れが足かせになっている可能性もあるので、こういったサービスを利用して住所を正規化すれば名寄せもしやすくなるだろうと思います。ただ、そもそも「正しい住所表記」の定義がない以上、そのデータで名寄せをするのはかなり無理があると思います。無理があることを何とかして実現しようとしているのでこういったサービスの存在意義があるのですが。

以前も書いたように、例えば郵便番号は1998年に5桁から7桁に拡張されましたが、それを思い切って15桁くらいに拡張して、その番号であらゆる住所を符号化してしまえば、住所表記の正規化をわざわざやらなくても名寄せが簡単に実現できます。それを郵便番号でやるのか、住所コードでやるのか、全く新しいコードでやるのかという議論はあろうかと思いますが、網羅的な番号が必要だということに変わりないのではないでしょうか。



関連記事

プロマネの右腕

クロスイデアでは、新サービス・新ビジネスの 立上げや計画を中心に
プロジェクトマネジメントの支援を行っています。

新サービスの企画を任されたけど どう進めていいか悩んでいる担当者、
部下に新しい企画を任せたけど このままで大丈夫か不安な管理職の方、
以下のサイトをご参照ください。
https://www.crossidea.co.jp/services/right-hand-pmo.html

YouTubeにて動画配信中!

プロジェクトマネジメントのノウハウを
YouTubeで配信しています。
ブログと併せてご活用ください。

Comments are closed.