Внешние инструменты от @kildor для работы с данными iNaturalist: готовимся к 1/8 финала Кубка

Дорогие друзья!

К нам присоединяются всё новые и новые пользователи. Время от времени мы повторяем некоторые наиболее важные сообщения. Это повтор вот этого поста с небольшими добавлениями: https://www.inaturalist.org/posts/46007-vneshnie-instrumenty-ot-kildor-dlya-raboty-s-dannymi-inaturalist-external-tools-by-kildor-for-inat-data


Каждый раз, когда наш проект проходит очередную круглую отметку, я пишу в конце, что для написания данного поста использован конвертер текстовых и табличных данных, который осуществляет разметку текста. Этот конвертер разработал Константин Романов (@kildor). Постепенно различных утилит, написанных Константином, становится всё больше. Хочу вас с ними кратко познакомить.

Полный список со всеми ссылками находится тут: https://kildor.name/inat/ . Можно смело не читать дальше, а переходить по ссылке. Инструменты очень простые и понятные, поэтому разобраться в них ничего не стоит. Я остановлюсь скорее на том, для чего каждый из этих инструментов может пригодиться.

Эта инструкция адресована, в первую очередь, экспертам, поскольку затрагивает вопросы чистки данных по видам, которые уже получили "Исследовательский уровень". Кроме того, многие аспекты будут полезны администраторам проектов и пользователям, целенаправленно документирующим флору и фауну отдельных мест и регионов. Этими инструментами очень удобно пользоваться в период проведения очередного этапа Кубка, когда в пылу борьбы пользователи загружают растения с самыми фантастическими названиями.


1) Новые виды в проекте (https://kildor.name/inat/new-species)

Позволяет посмотреть список видов, появившихся в проекте за выбранный промежуток времени. Можно смотреть проект целиком (вставив его id, например, new-flora-of-russia-novaya-flora-rossii или chuvash-republic-flora), а можно поставить фильтр на конкретного пользователя. Это особенно важно для постоянного мониторинга новых поступлений в тот или иной региональный или общероссийский проект. В основном, со стороны кураторов и экспертов для проверки правильности [кривых] определений и [бездумных] подтверждений.

Однако в описании утилиты написано: "Данный список примерен, и может не учитывать какие-то из наблюдений, в особенности если проект требует "Исследовательского уровня"." Это связано с промежутком между временем загрузки и временем верификации наблюдений. Тем не менее, для регулярного мониторинга новых поступлений вещь просто незаменимая. Можно смотреть через браузер (с гиперссылками на конкретные наблюдения), а можно скачать csv. Впрочем инструмент № 3 ещё более мощный!


2) Пропущенные виды (https://kildor.name/inat/missed-species)

Вещь очень удобная для целенаправленного поиска каких-либо видов в каком-либо регионе.

Можно поставить два фильтра: проект+другой пользователь. В этом случае, вы получите список видов, которые не найдены вами, но встречены соседом. Например, Виктор Степанов (@vist) сфотографировал 64 вида, которых в моих наблюдениях из Владимирской области отсутствуют.

Сравнивать с другим пользователем можно и генеральные списки найденных вами видов (поле проект оставьте пустым). Так, например, Марина Горбунова (@melodi_96) в списке найденных таксонов имеет 2422 вида, которые мне не попадались. Списки видов можно смотреть через браузер, а можно скачать csv.


3) Список видов в проекте (https://kildor.name/inat/species)

Инструмент для просмотра полного списка видов проекта, а также списка видов, которые встретил только указанный наблюдатель. Несмотря на всю понятность инструмента, его важность, на мой взгляд, лежит немного в другой плоскости. При выдаче списка видов проекта таксоны сортируются по числу наблюдений - самые редкие виды с единственной находкой в конце списка, а топ-виды наверху. Это позволяет экспертам и кураторам проектов пробегать глазами списки самых редких видов и быстро находить ошибки, поскольку ошибки в принципе не бывают массовыми. Повторюсь, это именно тот инструмент, который опытные участники могут активно использовать для чистки данных в период проведения Кубка.

Это могут быть и неправильные определения, и кривая номенклатура (два названия для одного вида), и культурные растения без галочек. Данный инструмент позволяет надёжно контролировать региональные списки и обращать внимание на нетривиальные вещи. Можно дополнительно добавлять ник пользователя или использовать только ник (без указания проекта) для получения списка видов какого-либо участника с гиперссылками. Списки видов можно смотреть через браузер, а можно скачать csv.


4) Участники проекта (https://kildor.name/inat/members)

Техническая утилита для выкачивания списка участников проекта. Для непопулярных проектов непринципиальна, для проектов с тысячами подписчиков - очень полезна. Так что я всегда знаю, кто у нас в подписчиках.


5) Скачивание наблюдений (https://kildor.name/inat/download-observations)

Скачивание наблюдений в формате CSV. Полученную выгрузку можно всесторонне анализировать по десяткам параметров.


6) Редактор постов в журналы (https://kildor.name/react/inat-converter/)

Тот самый конвертер текстовых и табличных данных, который осуществляет разметку текста для написания и оформления постов в нашем журнале.


Если вы ввели неправильное id проекта или ник пользователя, то появится вот такое сообщение: "Произошла ошибка при получении или обработке данных. Пожалуйста, попробуйте повторить позже. Если ошибка повторяется, вы можете написать автору (kromanov@gmail.com или @kildor)".

Огромное спасибо Константину за эти важные и очень полезные инструменты. Надеюсь, вы их оцените и будете чаще ими пользоваться.

Вопросы и пожелания пишите в комментариях.

Posted on August 19, 2021 04:35 PM by apseregin apseregin

Comments

No comments yet.

Add a Comment

Sign In or Sign Up to add comments