|
||||
|
OpenAlex OpenAlex - открытый сервис для поиска научных публикаций, открытая и свободная наукометрическая база. Это ресурс компании OurResearch, которая также известна благодаря запущенным ранее онлайн-сервисам ImpactStory и Unpaywall. OpenAlex, названная в честь Александрийской библиотеки - наследница проекта Microsoft Academic Graph (MAG), появившаяся в 2022 г. MAG задумывался как открытый конкурент Google Scholar и завоевал широкую популярность как источник метаданных публикаций c полноценной открытой лицензией. Когда в Microsoft неожиданно решили закрыть MAG, именно открытая лицензия позволила небольшому стартапу OurResearch использовать базу MAG как основу своего, еще более открытого, проекта. К 2023 г. он завоевал популярность и стал технологической основой многих сторонних сервисов и стартапов. В базе уже собрано более 250 миллионов записей о публикациях из 230 тысяч источников. Сейчас OpenAlex помимо данных MAG, составляющих костяк ее архивных данных, аккумулирует и обрабатывает метаданные CrossRef - системы, выдающей идентификаторы DOI львиной доле научных журналов мира. Это основной канал пополнения новыми публикациями. Кроме того, собираются метаданные MEDLINE (Pubmed), репозиториев препринтов (arXiv и т.д.) и данных (Zenodo и т.д.), информация о наличии открытых полных текстов из UnPaywall. Индексация роботом, на которой основан Google Scholar, применяется в OpenAlex, видимо, как второстепенный источник. Прямая индексация контента от издателей, на которой основаны модели Web of Science и Scopus, здесь не практикуется. Таким образом, OpenAlex - не столько первичный собиратель, сколько агрегатор многих открытых баз. Сервис пополняется сведениями из открытых источников и ведет базу данных с 5 типами объектов: публикации (works), авторы (authors), организации (institutions), издания (venues) и понятия (concepts). OpenAlex содержит стандартные уникальные идентификаторы для публикаций (doi), авторов (ORCID), источников (ISSN-L) и организаций (ROR), а для многих сущностей - и другие, например, Scopus Author ID. Соответственно, есть пять точек входа API, позволяющих получить отдельные сущности и их множества (простые и сгруппированные списки): https://api.openalex.org/works для публикаций, https://api.openalex.org/authors для авторов и т.д. Cервис доступен в виде превосходно документированного набора API-сервисов, для которых уже доступны удобные пакеты на языках R и Python. Теперь в OpenAlex появился работающий Web-поисковик публикаций. Уникальные особенности:
Веб-API работают также, как браузеры, отправляя запрос по определенному URL-адресу и получая разные данные. Это значит, что запросы к API вы можете тестировать в браузере без всякого программирования, вставляя в их адресную строку и изучая получаемый результат. Чаще всего он выдается в формате JSON - структурированном и размеченном тексте, понятном человеку, но громоздком. В Firefox по умолчанию встроен удобный просмотр JSON, в Chrome для этого потребуется плагин. Чтобы выгрузить и складировать данные в excel или csv, нужны два модуля Python - Requests (для обращения к базе и получения данных) и Pandas (для их выгрузки в табличном виде и последующего анализа). Информационные материалы:
Данные OpenAlex в отличие от WoS, Scopus, GS или eLIBRARY.ru доступны по самой свободной лицензии - CC0 (Public Domain), разрешающей любое использование, в т.ч. коммерческое.
Условия доступа: Доступ с любого компьютера, имеющего выход в Интернет
| |||
|
|