週末は古墳巡り

古墳とは、およそ3世紀から7世紀に築かれた墳丘状の墓のこと。その数、およそ20万基。

東京都の遺跡一覧をスクレイピングしてみた

昨日のコラムの続き。「古墳にコーフン協会」のブログ(最新全国古墳の数、多い順ランキング!(平成28年度調査) | 古墳にコーフン協会)で「31位)東京都:714」となっている。この「714」という数字を調べてみた。

東京都は「東京都遺跡地図情報インターネット提供サービス」で遺跡マップを公開している。これとは別に「世田谷区 遺跡一覧」とかでネット検索すると遺跡一覧のページが見つかる(トップページと思われるページは「404 Not Found error」でアクセスできない)。「表示方法選択」のページから各市区町村の一覧のページにリンクが張られているので、各市区町村の一覧のページのhtmlのtable形式をまとめて1つのcsvファイルに落とすプログラムをPythonで書いた(大田区の遺跡一覧は「404 Not Found error」になるので町名一覧から落とした)。こういう行為をWebスクレイピングと呼ぶそうだ。csvはエクセルのファイル形式の一つで、csvファイルにすればエクセルとかGoogleスプレッドシートとかで扱える。

簡単に結果を書くと、登録されている遺跡の数は7431、古墳時代に限定すれば1691、奈良時代は1727(古墳時代奈良時代でだぶる遺跡もある)、古墳時代に限定して「遺跡名」と「遺跡の概要」に「古墳」という文字列があるのは554、「[古]周溝」で119、「円墳」で325、「墳丘」で9、「葺石」で12、「石室」で109、「竪穴式石室」で5、「横穴式石室」で84、古墳時代もしくは奈良時代で「横穴墓」だと172となる。これらのだぶりを排除すると719となり、求める数字にかなり近づく。ところがよく見ると「古墳時代住居跡」とか「[弥~古墳]竪穴住居」や「[古墳~奈良]住居跡」や「[古墳以降]堀立柱建物跡」で「古墳」とカウントされたものがあり、これらを排除すると714と一致した。この数字が「⑧古墳・横穴」の「周知の埋蔵文化財包蔵地数」として東京都教育委員会から文化庁に報告されているのではなかろうか。

ところが、実際にはもう少し厄介で、いくつか問題がある。1つ目は、例えば港区の遺跡番号24番の遺跡名「丸山古墳」(いわゆる芝丸山古墳)の場合、すでに失われた陪塚が遺跡番号25番の「丸山古墳群」として登録されていて、かつ、丸山古墳群1号墳から9号墳までが遺跡番号25-1から25-9の枝番として登録されている。つまり、この場合は親番の遺跡番号25番がダブルカウントになる。これを排除すると675になる。

2つ目は、例えば府中市の遺跡番号37の遺跡名「御嶽塚古墳群」は「遺跡の概要」に「古墳 15基(御嶽塚古墳を含む)」とあるが、個別の枝番が発番されていない。これらは1つ1つ精査していかないと1基単位のカウントは難しい。

3つ目は、資料館の展示等では遺跡調査で古墳を検出としているのに遺跡一覧には古墳のことが記載されていない遺跡がある。具体的には、千代田区で円筒埴輪が出土した一ッ橋二丁目遺跡と、古墳が確認されている富士見二丁目遺跡がある。

4つ目は、今回スクレイピングの対象にした遺跡一覧はすでに更新が行われていないと思われ、最新の情報は「東京都遺跡地図情報インターネット提供サービス」で公開している。例えば、世田谷区の遺跡番号332番の大蔵横穴墓群は、世田谷区の遺跡一覧には記載されていない。ちょっと面倒だが、「東京都遺跡地図情報インターネット提供サービス」のスクレイピングも検討したい。

5つ目は、「周溝墓」の扱いで、今回は「周溝墓」はカウントの対象から外した。

それ以上に大きな問題は、当たり前だが、遺跡として認識されずに破壊された古墳・横穴墓や、まだ見つかっていない古墳・横穴墓はカウントされていない。例えば、文献[1]には「大田区内の台地斜面には500基をこえる横穴墓が存在したと推定されており」と記載されている。

文献

[1] 大田区立郷土博物館 2006「横穴墓のなぞ」

御嶽塚(府中市)
f:id:kofunmeguri:20210117195509j:image

にほんブログ村 歴史ブログ 考古学・原始・古墳時代へ
にほんブログ村