論文

基本情報

氏名 中藤 哲也
氏名(カナ) ナカトウ テツヤ
氏名(英語) NAKATOU TETSUYA
所属 中村学園大学 栄養科学部 栄養科学科
職名 准教授

題名

Testbed for Information Extraction from Deep Web 

単著・共著の別

著者

Yasuhiro Yamada Department
Yasuhiro Yamada
Tetsuya Nakatoh

担当区分

概要

Search results generated by searchable databases are served dynamically and far larger than the static documents on the Web. These results pages have been referred to as the Deep Web [1]. We need to extract the target data in results pages to integrate them on different searchable databases. We propose a testbed for information extraction from search results. We chose 100 databases randomly from 114,540 pages with search forms. Therefore, these databases have a good variety. We selected 51 databases which include URLs in a results page and manually identify target information to be extracted. We also suggest evaluation measures for comparing extraction methods and methods for extending the target data.

発表雑誌等の名称

Proceedings of the 13th International World Wide Web Conference on Alternate Track, Papers and Posters, WWW Alt. 2004

出版者

Association for Computing Machinery, Inc

開始ページ

346

終了ページ

347

発行又は発表の年月

2004/05/19

査読の有無

有り

招待の有無

無し

記述言語

英語

掲載種別

研究論文(国際会議プロシーディングス)

国際・国内誌

国際共著

ISSN

eISSN

DOI

10.1145/1013367.1013468

Cinii Articles ID

Cinii Books ID

Pubmed ID

PubMed Central 記事ID

形式

無償ダウンロード

JGlobalID

arXiv ID

ORCIDのPut Code

DBLP ID