MISC

基本情報

氏名 中藤 哲也
氏名(カナ) ナカトウ テツヤ
氏名(英語) NAKATOU TETSUYA
所属 中村学園大学 栄養科学部 栄養科学科
職名 准教授

題名

WebDBのQuery Formにおけるメタデータ自動抽出

単著・共著の別

著者

中藤 哲也
大森 敬介
廣川 佐千男

担当区分

概要

各フィールドの属性値を指定することによりレコード検索を行うことができるWeb 上のデータベース(WebDB)が増えている.WebDB が提供するレコードの各フィールドの属性名のリストは, そのWebDB のメタデータと考えることができ, Web インタフェースの背後にあるデータベースを理解するために必須である.多数のWebDB に対し, 分類や選択を行ったり, 同種の(homogeneous)WebDB あるいは異種(heterogeneous)のWebDB のメタサーチを構築するためにも,このメタデータは必須である.本論文ではWebDB の検索画面を構成するHTML のフォームからメタデータを自動的に抽出する方式を提案する.また, 国内の2,800 件のWebDB から無作為に選んだ134 件のサイトについて, メタデータ抽出実験を行い, 適合率, 再現率, F 値の3 つの観点から抽出性能を評価する.There are increasing number of WebDBs (Web Databases) which return a list of records with respect to a complex query that specifies each field of records to be searched for. The attribute set of a WebDB can be thought as a metadata and is important to understand the database behind the Web interface. Moreover, it is indispensable to classify, to chose and to create homogeneous and/or heterogeneous metasearch engines from a large pool of WebDBs. This paper proposes a method which extracts the metadata from the HTML form of the WebDB. An empirical evaluation is conducted by assessing precision, recall an F-measure of extracted attributes for 134 sites randomly chosen from 2,800 WebDBs.

発表雑誌等の名称

日本データベース学会letters

出版者

日本データベース学会

5

2

開始ページ

97

終了ページ

100

発行又は発表の年月

2006/09

査読の有無

無し

依頼の有無

無し

記述言語

日本語

掲載種別

国際・国内誌

国際共著

ISSN

1347-8923

eISSN

DOI

Cinii Articles ID

120005657628

Cinii Books ID

Pubmed ID

PubMed Central 記事ID

形式

無償ダウンロード

JGlobalID

arXiv ID

ORCIDのPut Code

DBLP ID