Система машинного обучения для анализа миллиона научных статей

Печать
Опубликовано: 08 ноября 2017 08 ноября 2017
Просмотров: 1048 1048

Разработана автоматизированная система, которая может анализировать миллионы исследовательских работ и извлекать из них «рецепты» производства конкретных материалов.

В последние годы создано множество вычислительных инструментов для разработки новых материалов, полезных для целого ряда приложений: от энергетики и электроники до авиации и гражданского строительства. Но разработка технологии производства этих материалов по-прежнему зависит от сочетания опыта, интуиции и обзоров литературы.

Команда исследователей из Массачусетского технологического института, Массачусетского университета в Амхерсте и Калифорнийского университета в Беркли надеются исправить этот разрыв в области автоматизации разработки материалов с наукой при помощи новой системы искусственного интеллекта, которая могла бы быть использована в исследовательских работах для вывода «рецептов» производства конкретных материалов.

 

 

 

Исследователи представляют базу данных, содержащую «рецепты» материалов, извлеченные из миллионов документов. Ученые и инженеры могут ввести название целевого материала и любые другие критерии - материалы-предшественники, условия реакции, процессы изготовления - и вытащить предлагаемые «рецепты».

В качестве шага к реализации этого видения авторы методики разработали систему машинного обучения, которая может анализировать исследовательскую работу, определять какие из ее пунктов содержат «рецепты» материалов и классифицировать слова в этих параграфах: названия целевых материалов, числовые количества, названия оборудования, условия эксплуатации, описательные прилагательные и тому подобное.

В статье, опубликованной в последнем выпуске журнала «Chemistry of Materials», авторы также демонстрируют, что система машинного обучения может анализировать извлеченные данные для определения общих характеристик классов материалов, таких как различные диапазоны температур, которые требуются при их синтезе, или конкретные характеристики отдельных материалов - например, различные физические формы, которые они будут принимать, при изменении условий изготовления.

Источник: Edward Kim, Kevin Huang, Adam Saunders, Andrew McCallum, Gerbrand Ceder, Elsa Olivetti. Materials Synthesis Insights from Scientific Literature via Text Extraction and Machine Learning. Chemistry of Materials, 2017; DOI: 10.1021/acs.chemmater.7b03500