gen. | text corpus | текстовый корпус (термин корпусной лингвистики – раздела языкознания, занимающегося разработкой, созданием и использованием лингвистических (текстовых) корпусов – совокупности текстов, собранных в соответствии с определёнными принципами, размеченных по определённому стандарту и обеспеченных специализированной поисковой системой, как правило, объёмом 100 – 500 млн. слов. Целесообразность создания текстовых корпусов объясняется: представлением лингвистических данных в реальном контексте; достаточно большой представительностью данных (при большом объёме корпуса); возможностью многократного использования единожды созданного корпуса для решения различных лингвистических задач, таких, как, напр., реализация графематического и лексико-грамматического анализа текста и др. Alex_Odeychuk) |