各フィールドの属性値を指定することによりレコード検索を行うことができるWeb 上のデータベース(WebDB)が増えている.WebDB が提供するレコードの各フィールドの属性名のリストは, そのWebDB のメタデータと考えることができ, Web インタフェースの背後にあるデータベースを理解するために必須である.多数のWebDB に対し, 分類や選択を行ったり, 同種の(homogeneous)WebDB あるいは異種(heterogeneous)のWebDB のメタサーチを構築するためにも,このメタデータは必須である.本論文ではWebDB の検索画面を構成するHTML のフォームからメタデータを自動的に抽出する方式を提案する.また, 国内の2,800 件のWebDB から無作為に選んだ134 件のサイトについて, メタデータ抽出実験を行い, 適合率, 再現率, F 値の3 つの観点から抽出性能を評価する.There are increasing number of WebDBs (Web Databases) which return a list of records with respect to a complex query that specifies each field of records to be searched for. The attribute set of a WebDB can be thought as a metadata and is important to understand the database behind the Web interface. Moreover, it is indispensable to classify, to chose and to create homogeneous and/or heterogeneous metasearch engines from a large pool of WebDBs. This paper proposes a method which extracts the metadata from the HTML form of the WebDB. An empirical evaluation is conducted by assessing precision, recall an F-measure of extracted attributes for 134 sites randomly chosen from 2,800 WebDBs. |