Снова обновлена "Копилка" (16 декабря 2022 г.)

Дорогие друзья!

В восьмой модели автоматического распознавания видов, которая была запущена 19 августа 2022 г., были второй раз использованы новые критерии отбора видов для обучающего датасета: теперь минимальный порог равен не ста наблюдениям, а ста фотографиям.

Осенью был анонсирован новый алгоритм добавления видов в модель автоматического распознавания: примерно раз в месяц те виды, которые добрались до квалификационного порога, добавляются в модель без пересчёта включенных ранее видов. Это позволило заметно ускорить включение новых растений. Новая модель (v1.5, т.е. пятая ежемесячная порция обновлений) основана на данных, выгруженных из системы 13 ноября - в ней появилось 474 новых вида растений, в т.ч. виды флоры России.

После этого дополнения модели, мы быстро сделали чистку "Копилки флоры России", поскольку в релизе был опубликован аккуратный перечень новых видов. Оказалось, что за месяц 13 из 300 видов копилки стали известны системе, и она их предлагает пользователям при определении снимков.

После обновления список снова включает 300 видов (правда, теперь гораздо более редких), по каждому из которых нужно набрать ровно 100 наблюдений. Мы оставили критерий "100 наблюдений" для удобства как гарантия того, что вид точно будет включён в очередную модель. После выхода обновлений мы будем регулярно менять виды, преодолевшие этот порог, на те, что находятся ниже по списку.

Ещё 19 видов пока не включены в модель, но по ним уже набрано больше 100 наблюдений. Вот их перечень (они не включены в копилку):

Acer truncatum (Клён усечённый)
Alchemilla cymatophylla (Манжетка волнистолистная)
Asperula supina (Ясменник низкий)
Bolboschoenus planiculmis (Клубнекамыш плоскостебельный)
Carpesium abrotanoides (Карпезиум полынный)
Eleocharis uniglumis (Болотница одночешуйная)
Euphrasia hirtella (Очанка волосистенькая)
Hesperis pycnotricha (Вечерница густоволосистая)
Hypericum erectum (Зверобой прямой)
Juncus triglumis (Ситник трёхчешуйный)
Meniocus linifolius (Бурачок льнолистный)
Noccaea praecox (Нокея ранняя)
Populus simonii (Тополь Симона)
Pyrus ussuriensis (Груша уссурийская)
Quercus macranthera (Дуб крупнопыльниковый)
Rhamnus davurica (Жостер даурский)
Salix saxatilis (Ива скальная)
Suaeda prostrata (Сведа простёртая)
Teesdalia coronopifolia (Тисдайлия коронополистная)


Зачем нужна копилка и как ей пользоваться?

Цель копилки - максимально ускорить процесс сбора фотонаблюдений по видам, которым чуть-чуть не хватает для включения в модель автоматического распознавания видов. Эти фото будут использованы в следующем обучающем наборе. Все мы замечаем, что каждый раз модель становится всё более компетентной и редко допускает грубые ошибки.

Участники целенаправленно пополняют копилку, ориентируясь как на список видов (добавляя региональные фильтры), так и на карту, по которой мы можем глянуть на ближайшие точки видов-кандидатов и постараться сделать дополнительные наблюдения именно этих видов.

Региональные примеры

Крым: 68 видов

Подмосковье: 26 видов

Дагестан: 57 видов

Иркутская область: 40 видов

Приморский край: 77 видов

Камчатка: 41 вид

Именно первое включение вида в модель основано на наиболее чистом датасете фотонаблюдений, поскольку эти изображения вручную определены экспертами и наблюдателями (без учета мнения модели). Затем неизбежно начинают накапливаться ошибки, основанные на использовании подсказок, и обучение следующей модели хотя бы частично становится основанным на автоматически определенных фотографиях. Впрочем, обучающий массив при этом неизбежно растёт.


Подписались здесь на персональные уведомления журнала "Флора России": @natalia_gamova, @marina_gorbunova, @andrey_sdobnikov, @alexfamilyteam, @serycherny, @oleg_kosterin, @oksana_serikova, @taimyr, @yurii_basov, @madmanserg, @urij777, @tsn, @pavelsus, @denis_ivanov, @daba, @yuriydanilevsky, @julia_shner, @irinabobyleva, @tatyana_ilina, @windof, @petr_kosachev, @tanniii66, @grigoriy_yashin, @svetlanakutueva, @naturalist19358, @prokhozhyj, @forestru, @marina_sad, @tls-60, @cat_arch_angel, @irina_lebedeva83, @hoktokon, @daria_dru, @millione, @nikita_gerasin, @yuliaspiridonova, @woodmen19, @konstantin_shiryaev, @sennator, @stepan_vdovichenko, @nikolaydorofeev, @anaumkin, @svetlana-bogdanovich, @aleks-khimin, @pavelkomkov, @katya, @nikolay_sobolev, @dinanesterkova, @magrat666, @svetlana_katana, @irinasavenko, @liyixuan, @eugenia_urusova, @chimik, @naturalist57011, @tatianavladimirova, @v199rus, @wildpendulum, @dakileno, @gushchina_angelina, @pyakai, @danilinav, @npz, @tivanik, @okasana, @solisia, @cyathus, @cryptobasis, @vera_sokolova, @ev_sklyar, @alexandrtichonov, @caseymclowe, @mallaliev, @beerolha, @olga-2021, @olga_neogeo, @pamari, @alex_iosipenko, @alexander_ignatenko, @dni_catipo, @yaroslavmagazov, @naturalist34144, @zhu_lixun, @liyixuan, @iljar, @phlomis_2019, @savva_chigarkov, @sansan_94, @elena526, @ivan_savinov, @a-travva, @aleksandrebel, @eliooblomoff, @natalya_vilyaeva, @antropov_alexandr, @xueqiqi, @sokolkov2002, @pavel_golyakov, @aeroself, @alexanderdubynin, @pushai, @kristina_k, @tatiana_dolgova, @tr3gl_svg, @volnushka, @alexanderlakomov, @tatiana_moscow, @tomegatherion, @vladimirpenzyak, @vikaryabkova, @xueqiqi, @ksenia_urakova, @eremchi, @siburhan, @tatiana_gerasenko, @kazakovdenis, @zhang_luyu, @natalia_trifuz, @divitre, @dmitrii_mostovoi, @olga2019kuryakova, @evgeniyaast, @anastasiaredflower99, @anastasiya_spb, @svetlanakhanty, @ekaterinavoinova, @sergilus, @osting, @ninacourlee, @evgeny_ananyev, @irine_shlojmis, @wkent, @mariasakal, @elena_tikhonova, @evgeniq_benihanov, @ankhen, @radlena, @gerda_new, @komar281, @lilia_rakitianskaia, @zemleved, @igalka (если вы заполняли форму, но вас тут нет, значит, вы написали свой ник с ошибкой - заполните форму ещё раз).

Posted on December 16, 2022 04:46 AM by apseregin apseregin

Comments

А вот интересно, пересматривается ли модель электронного зрения по мере существенного пополнения наблюдений уже имеющихся в ней видов. По идее это имело бы смылс так как учет большего количества информации увеличивал бы точность - хотя бы в части вегетирующих и ювенильных особей, отдельных частей растения.

Posted by oleg_kosterin over 1 year ago

Вот именно. А то в первичную модель попадают наблюдения и не-исследовательского уровня, а там может быть такое...

Posted by taimyr over 1 year ago

@taimyr, Игорь, разумеется, общая модель обновляется, но прежними темпами: примерно раз в год (плюс-минус). Последняя вышла в августе.

Posted by apseregin over 1 year ago

Add a Comment

Sign In or Sign Up to add comments