Пространственный тест данных 1

Дорогие друзья!

Накопление данных в проекте "Флора России" вызывает вопрос: а насколько эти данные равномерно распределены? Как это можно оценить?

Сегодня история сосны обыкновенной Pinus sylvestris (без карт, обсчитывал таблицы).

Для того, чтобы дать представление о пространственной выборке, я скачал все точки Pinus sylvestris в виде csv-файла: 3243 записи на вечер 19.05.2020. Они включают популяции традиционно выделяемых подвидов/разновидностей сосны, например, Pinus sylvestris var. hamata (Крым, Кавказ).

Вся территория России была разбита на две сетки - с ячейками 1x1 градус и 0,1x0,1 градуса. Примерно так, как это делается в проектах по сеточному картированию.

Если говорить в километровом выражении, то большая ячейка (1x1 градус) имеет стороны 111,1 км (по широте) и постепенное уменьшение размера по долготе: от 78,7 км на широте Симферополя до 39,9 км на широте Мурманска. Иными словами, ее площадь уменьшается в этих случаях от 8744 кв. км до 4433 кв. км (около 7000 кв. км на широте Москвы).

Малая ячейка (0,1x0,1 градус) имеет, соответственно, стороны 11,1 км (по широте) и постепенное уменьшение размера по долготе: от 7,9 км на широте Симферополя до 4,0 км на широте Мурманска. Таким образом, ее площадь уменьшается в этих случаях от 87,4 кв. км до 44,3 кв. км (около 70 кв. км на широте Москвы).

3243 точки сосны на iNaturalist превратились в:
1213 малых ячеек, занимающих общую площадь около 85 тыс. кв. км
319 больших ячеек, занимающих общую площадь около 2,2 млн кв. км

Иными словами, при шаге ячеек 0,1x0,1 градус в каждом квадрате, где регистрируют сосну, её отмечают в среднем 2,7 раз, а при шаге ячеек 1x1 градус - 10,2 раза.

"Аномальные" большие ячейки, 50 штук (даны координаты левого нижнего угла, число точек сосны в квадрате 1x1 градус и общая привязка для первых десяти):

55-037 259 Москва
54-037 137 Серпухов
54-083 127 Академгородок НСК
56-072 125 Большие Уки - юг
52-035 112 Железногорск
57-072 98 Большие Уки - север
54-048 88 Ульяновск
55-046 87 Шумерля
56-037 74 Дмитров
55-038 73 Раменское
53-034 63
53-084 57
55-036 55
55-040 53
53-049 52
53-083 49
54-043 44
56-042 44
66-033 44
58-038 40
55-039 39
56-034 39
51-039 35
54-055 32
56-040 28
56-060 27
56-039 26
55-048 25
55-049 25
60-030 25
58-050 23
55-043 22
54-045 21
56-085 21
52-034 20
56-038 20
52-103 19
56-044 19
56-043 18
60-029 17
57-065 15
51-082 14
51-083 14
54-046 14
57-038 14
60-069 14
54-047 13
55-042 13
56-084 13
58-044 13

"Аномальные" малые ячейки, 50 штук (даны координаты левого нижнего угла, число точек сосны в квадрате 0,1x0,1 градус и общая привязка):

548-0830 75 Академгородок - запад
548-0375 70 ПТЗ
543-0485 60 Ульяновск (Заволжский р-н)
569-0725 51 Большие Уки - запад
569-0726 40 Большие Уки - восток
554-0464 38 Шумерля - юго-восток
554-0463 37 Шумерля - юго-запад
522-0353 32 Железногорск - юг
572-0725 32 оз. Тевриз
548-0831 30 Академгородок - восток
558-0378 25

533-0846 24

572-0722 23

533-0845 22

666-0332 22

522-0354 21

543-0484 21

548-0376 21

567-0395 20

532-0343 19

534-0494 18

547-0432 16

532-0344 15

553-0373 15

556-0435 15

558-0379 15

559-0378 15

560-0374 15

561-0347 15

565-0850 14

523-0353 13

547-0376 13

557-0374 13

558-0374 13

609-0690 13

556-0381 12

558-0372 12

560-0370 12

580-0382 12

514-0807 11

547-0431 11

548-0558 11

556-0373 11

569-0727 11

571-0724 11

523-0352 10

534-0493 10

561-0385 10

580-0387 10

522-0352 9

Накопление данных приводит к увеличению диспропорции в плотности данных за счёт мест, где работают топ-наблюдатели (или их активные группы) причём с перевесом в пользу легко наблюдаемых в течение всего года видов. У сосны плотность данных превышает 1 наблюдение на 1 кв. км около Академгородка (Новосибирская область) или Приокско-Террасного заповедника (Московская область).

Привлечение новых участников позволяет выравнивать эту диспропорцию за счёт более равномерного пространственного сэмплинга, однако перекос в пользу легко наблюдаемых видов остается. В 712 малых ячейках (из 1213) сосну отмечали один раз - 22% наблюдений закрывают 59% ячеек.

Статистические сведения по регионам не отражают внутренней пространственной неоднородности сэмплинга. Так, в Омской области 49% наблюдений сосны сделаны в трех ячейках в одном административном районе на общей площади около 200 кв. км, в Новосибирской области 67% наблюдений сосны - в ближайших окрестностях Академгородка на площади не более 150 кв. км.

Posted on May 19, 2020 06:23 PM by apseregin apseregin

Comments

Мы уже приметили пару мест, откуда совсем нет данных, вообще, к осени есть планы выезжать планомерно.

Posted by marina_gorbunova almost 4 years ago

Алексей Петрович, а вывод то какой, так сказать практический? Какой совет можете дать наблюдателям?
К примеру я когда по городу хожу стараюсь фотографировать такой вид который уже есть только если на данной улице я его не фотографировал или если чем то привлекло моё внимание это растение (ну или если я с первого взгляда не знаю, что это и думаю а вдруг чего то новое). Но разделение по улицам гораздо меньшие площади чем по квадратами 0.1 на 0.1 градус и всё равно получается преобладание одних видов над другими.
С другой стороны, по идее это же должно показать не только наличие вида, но и его обилие, так сказать.. ну с той же сосной: в одной части города например её больше растет чем в другой, а потому и наблюдений там больше.

Posted by yurii_basov almost 4 years ago

Здесь не может быть вывода, перед каждым исследованием стоят свои цели. Здесь, скорее, континентальный уровень.
Страна огромная, люди преимущественно в городах сконцентрированы, не миллионеры, чтобы в свободное время разъезжать, куда вздумается, а многие в принципе застряли сейчас. Пожалуй, можно сформулировать это так - точка вида А в 10 км от другой такой в 10 раз ценнее для целей атласа, чем точка в 1 км. А точка в 100 км - ценнее во 100 крат, просто потому, что до неё надо ещё добраться.
Но не в коем случае не "хуже" и не "лучше". Кроме того, интенсивная инвентаризация биоты в хорошо знакомых местах - очень важная вещь, которая неизбежно приводит к стремительной концентрации данных по обычным видам. А сами данные карман не тянут, разве что отнимают экспертное время при подтверждении фотографиий.

Posted by apseregin almost 4 years ago

Спасибо за ответ, я сначала подумал, что не совсем верно вас понял, но нет - всё верно.

Posted by yurii_basov almost 4 years ago

Очень интересно. Вот 2 момента еще очень сильно интересуют.
Вырисовываются ли границы ареалов уже по наблюдениям у отдельных видов?
У каких регионов больше наблюдений каких видов, здесь же не только доступность влияет, но и предпочтения людей позволяют выявить неформальный символ региона.

Posted by aleks-khimin almost 4 years ago

@aleks-khimin тут, на мой взгляд, не только предпочтения влияют, у меня вот, например, больше всего наблюдений полыни, но не потому что мне нравится полынь, а потому что, я смотрю на неё и мне кажется, что это не обыкновенная, а какая то другая. Правда, в итоге, чаще всего, я всё-таки ошибаюсь..

Posted by yurii_basov almost 4 years ago

Александр, ведущие виды можно посмотреть в статистике на главной страничке каждого регионального проекта. Это проще, чем выкачивать и обсчитывать csv. Границы ареалов - да, безусловно, но только по массовым и легко различимым видам. С осоками и злаками всё хуже. Ну и, конечно, отсутствие данных из таёжных регионов и крайнего севера сказывается. Ареалы лучше смотреть в GBIF, где к нашим данным добавляются данные гербариев и других баз. Да и карты там посимпатичнее

Posted by apseregin almost 4 years ago

как скачивать все точки вида, интересно...

Posted by yu_postnikov almost 4 years ago

Внизу поисковой формы с фильтрами есть ссылка для скачивания

Posted by apseregin almost 4 years ago

Спасибо. Получилось.

Posted by yu_postnikov almost 4 years ago

О, кстати о соснах :).
А это у меня что за сосна? Из-под Геленджика.

https://www.inaturalist.org/observations/41537257
https://www.inaturalist.org/observations/41538825

Posted by prokhozhyj almost 4 years ago

Add a Comment

Sign In or Sign Up to add comments