PESI Taxon Match Tool: быстрая сверка

Ранее (в заметке про симпозиум в Нижнем Новгороде) на этом сайте уже упоминался европейский инфраструктурный проект PESI (Pan-European Species directories Infrastructure ). Рассказ о данном проекте в целом мог бы быть очень обширным. Однако пока я ограничусь описанием лишь одного инструмента, предоставляемого порталом проекта. Инструмент в своем роде уникальный, и, как мне кажется, может быть чрезвычайно полезен любому специалисту по биоразнообразию: PESI Taxon Match Tool.

Хорошо известная проблема — корректность написания названий таксонов. Увы, как верно отмечал Луций Анней Сенека, errare humanum est. Даже у внимательного человека добросовестные ошибки в названиях таксонов — регулярно встречаются. Но, как говорил далее тот же Сенека — sed in errare perseverare diabolicum, то есть злом являются не сами ошибки (они свойственны человеку), а упорство в них. Поэтому важная часть работы добросовестного специалиста по подготовке любого каталога фауны (флоры) — проверка точности названий. Ручная же выверка названий по таксономическим каталогам, особенно в бумажном их виде — долгая и трудоемкая задача. И тоже не дающая гарантий, ибо делается тем же человеком. Безусловно, вычислительная техника может на порядки повысить скорость и эффективность такой работы. Программа-робот потенциально может сравнивать тысячи тысяч названий в секунду и делать это с меньшим количеством ошибок. Однако, по известным причинам, даже электронные версии таксономических каталогов — почти абсолютно недоступны. Проверять названия по одному — работа лишь немногим более эффективная, чем сличать по книге. Поэтому создание сервиса, который мог бы пакетно обрабатывать список имен, сравнивая их с заданным словарем — немного очевидная идея. Но до недавнего времени ее доступной реализации не существовало.

Taxon Match Tool — как раз восполняет эту пустоту, давая возможность каждому сравнить разом весь имеющийся у него список с электронными каталогами европейской флоры и фауны портала PESI. Работа сервиса крайне проста. Вы готовите файл (просто текст, тестовая таблица .csv (comma-separated values) или таблица MS Excel (с одной таблицей в файле)), загружаете его через форму, устанавливаете необходимые настройки (их немного и они вполне очевидны), и через несколько шагов получаете таблицу сравнения, которую можно сохранить и использовать в дальнейшей работе. Счастливые пользователи систем управления данными о биоразнообрации (или просто таблиц с названиями таксонов) могут сразу использовать свои данные, просто скопировав необходимые столбцы в отдельный файл. Несчастливые (или просто немного ленивые) люди могут использовать, например, этот файл (список таксонов полужесткокрылых Нижнего Поволжья из соответствующей базы данных на этом сайте — текстовый файл в кодировке UTF-8, в котором название и его автор разделены знаком табуляции).

Разумеется, грамотное использование данного сервиса (как и любого) требует использования прямых рук и здорового головного мозга. Например, отсутствие в базе данных PESI таксона с исходным названием или иное написание вовсе не обязательно означает неправильность написания исходного названия (равно как и наоборот, кстати). Это скорее «звоночек» — повод еще раз себя проверить уже по научным каталогам и современной таксономической литературе. Характерный пример: название клопа-щитника Tarisa salsae сервис показывает как «созвучное» «правильному» Tarisa salasolae. На самом же деле ошибка здесь как раз в базе данных PESI: вид был описан покойным Изяславом Моисеевичем Кержнером в Определителе насекомых Европейской части СССР именно как «salsae» и с явным указанием, что он встречается на анабазисе солончаковом (Anabasis salsa) «salsasalsae«, а не «Salsola — salsolae» (что предполагает точка зрения сервиса). Хотя в случае Aelia furcata, например – прав как раз портал (правильное написание – Aelia furcula, и это будет при очередном исправлении базы данных учтено) Ну и многие виды, не встречающиеся на территории стран Европейского союза — в базе просто отсутствуют. Таксономия и систематика в базе далеко не всегда является однозначной. Поэтому — «все врут». Результаты, выдаваемые PESI Taxon Match Tool — почва для размышления и углубленной проверки, а не истина в последней инстанции.

Так что бездумная работа с такими сервисами может принести больше вреда, чем пользы. К сожалению или к счастью, идея создания «всеобщего и истинно верного» списка таксонов (крайне популярная в разных кругах последние лет 10) — не только вредная, но еще и совершенно утопическая и неосуществимая. Всегда будут группы, систематика которых не имеет единого общепринятого выражения. Всегда будут виды со спорным статусом. Степень проработанности систематики и таксономии разных групп организмов совершенно разная. То есть даже если представить себе фантастическую ситуацию, когда легионы легионов специально обученных людей без единой ошибки обрабатывают все публикуемые номенклатурные акты и ведут некий единый свод валидных названий — его тоже нельзя будет использовать без включения мозга головы. Ибо без знания систематики конкретной группы все равно будет невозможно понять смысл происходящих изменений и адекватно оценить положение того или иного таксона. Ну и не следует забывать древнюю программистскую мудрость, гласящую, что «каждая найденная в коде ошибка — предпоследняя». Любую базу названий, каталог и т.п. — делают люди, и ситуации, подобные случаю с Tarisa salsae — будут неизбежно повторяться. _Любой_ список названий — авторское произведение, отражающее только текущую точку зрения автора. И не обязательно — правильную. «Данных свыше» абсолютно верных списков — нет и никогда не будет.

Будьте внимательны. Пишите названия таксонов правильно. PESI Taxon Match Tool — хороший помощник для внимательного и вдумчивого специалиста. Но «если слепой поведет слепого — оба упадут в яму» — примерно так и есть.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *