Овсянников М.С.

УДК 681.5, 004.5, 025.4.03

ОВСЯННИКОВ МИХАИЛ СЕРГЕЕВИЧ, ассистент,

Michael.Ovsyannikov@gmail.com

ФИЛОНОВ МИХАИЛ АЛЕКСАНДРОВИЧ, ассистент,

mail@mikefilonov.ru

РЯПОЛОВ ЯРОСЛАВ ИГОРЕВИЧ, студент,

littlepantry@gmail.com

Томский государственный университет,

634050, г. Томск, пр. Ленина, 36

ТЕОРЕТИЧЕСКИЕ  АСПЕКТЫ  СОЗДАНИЯ  БИБЛИОГРАФИЧЕСКОЙ  БАЗЫ  ДАННЫХ  ПО  СТРОИТЕЛЬНОЙ  ФИЗИКЕ

В статье приводятся математические и информационные основы, положенные в основу автоматизированной базы научных статей и публикаций, разработанной для лаборатории строительной физики ТГАСУ. Рассматриваемое программное решение предназначено для автоматизированного сбора и обработки научных публикаций по строительной физике, опубликованных в сети Интернет.

Ключевые слова: строительная физика, библиографическая база данных, индексация, метаданные, web-mining.

Библиографическийсписок

  1. Lawrence, S. Online or invisible / S. LawrenceNature. – 2001. –Vol. 411. – №. 6837. – P. 521.
  2. Crystal, A. Metadata and Search: Global Corporate Circle / A. Crystal, P. Land // DCMI 2003. Workshop, Seattle, Washington, USA (2003), Retrieved (April 3, 2004) from http://dublincore.org/groups/corporate/Seattle/
  3. Seymore, K. Learning hidden Markov model structure for information extraction / K. Seymore, A. McCallum, R. Rosenfeld // AAAI 1999. Workshop on Machine Learning for Information Extraction (1999).
  4. Automatic document metadata extraction using support vector machines / H. Han, C.L. Giles, E. Manavoglu [etc.] // Proceedings of the 3rd ACM/IEEE-CS Joint Conference on Digital Libraries. International Conference on Digital Libraries. IEEE Computer Society Press, Washington, DC (2003). –Р. 37–48.
  5. Giles, C.L. CiteSeer: An Automatic Citation Indexing System / C.L. Giles, K.D. Bollacker, S. Lawrence // Proceedings of the third ACM conference on Digital libraries, Pittsburgh, Pennsylvania, United States. – 1998. – P. 89–98.
  6. Fateman, R. How to find mathematics on a scannedpage / R. Fateman// Proc. SPIE Vol. 3967, Document Recognition and Retrieval VII. Daniel P. Lopresti; Jiangying Zhou (eds), December 1999. – Р. 98–109.
  7. Optical character recognition and parsing of typeset mathematics / R. Fateman, T. Tokuyasu, B.P. Berman [etc.] // Journal of Visual Communication and Image Representation. – 1996. –Vol. 7. – № 1. – Р. 2–15.

______________________________

 OVSYANNIKOV MICHAEL SERGEEVICH, assistant,

Michael.Ovsyannikov@gmail.com

FILONOV MICHAEL ALEKSANDROVICH, assistant,

mail@mikefilonov.ru

RAPOLOV YAROSLAV IGOREVICH, student,

littlepantry@gmail.com

Tomsk State University,

634050, Tomsk city, Lenina st., 36

THEORETICAL  ASPECTS  OF  BIBLIOGRAPHICAL  DATABASE  IMPLEMENTATION  FOR  BUILDINGS  PHYSICS

Article presents mathematical and informational bases of automated database of scientific papers and research documentation for laboratory of buildings physic of TSUAB. Described software designed for automatic web-mining, search and processing of scientific papers published in the Internet on subject of buildings physic.

Keywords: buildings physic, bibliographic database, indexing, metadata, web-mining.

Статья | (353 Кб)