Subject | Russian | English |
gen. | выравнивание корпуса параллельных текстов | alignment (идентификация соответствующих друг другу предложений в обеих половинах параллельного текста – совмещенного документа, состоящего из версий соответствующего текста на языке оригинала и языке перевода. Выравнивание корпуса параллельных текстов на уровне предложений является необходимой предпосылкой для решения лингвистических задач. В процессе перевода предложения могут разделяться, сливаться, удаляться, вставляться или менять последовательность Alex_Odeychuk) |
gen. | двуязычных корпус текстов | parallel collection of translations (оригинал – перевод Alex_Odeychuk) |
gen. | корпус многоязычных текстов | polylingual corpus (Alex_Odeychuk) |
gen. | корпус одноязычных текстов | monolingual corpus (Alex_Odeychuk) |
gen. | корпус параллельных текстов | parallel corpus (Alex_Odeychuk) |
gen. | корпус параллельных текстов | parallel text corpus (Alex_Odeychuk) |
gen. | корпус параллельных текстов на славянских и прочих языках | parallel corpus of Slavic and other languages (Alex_Odeychuk) |
gen. | корпус разноязычных текстов | polylingual corpus (Alex_Odeychuk) |
gen. | корпус разноязычных текстов | multilingual corpus (Alex_Odeychuk) |
gen. | корпус текстов | text corpus (ssn) |
gen. | корпус текстов | corpus (комп.лингвистика Марина Захаревская) |
gen. | корпус текстов парламентского делопроизводства | parliamentary proceedings corpus (Alex_Odeychuk) |
gen. | корпус трёхъязычных текстов | trilingual corpus (Alex_Odeychuk) |
gen. | разметка корпуса параллельных текстов | parallel tagging (морфологическая, синтаксическая и семантическая разметка текстов: указание ударений, грамматических классов, границ словосочетаний в тексте и т.п. Alex_Odeychuk) |
AI. | статистические методы обработки крупных корпусов текстов | statistical techniques over large corpora (Alex_Odeychuk) |
gen. | текстовый корпус | text corpus (термин корпусной лингвистики – раздела языкознания, занимающегося разработкой, созданием и использованием лингвистических (текстовых) корпусов – совокупности текстов, собранных в соответствии с определёнными принципами, размеченных по определённому стандарту и обеспеченных специализированной поисковой системой, как правило, объёмом 100 – 500 млн. слов. Целесообразность создания текстовых корпусов объясняется: представлением лингвистических данных в реальном контексте; достаточно большой представительностью данных (при большом объёме корпуса); возможностью многократного использования единожды созданного корпуса для решения различных лингвистических задач, таких, как, напр., реализация графематического и лексико-грамматического анализа текста и др. Alex_Odeychuk) |
gen. | файл одноязычного корпуса текстов | monolingual corpus document (Alex_Odeychuk) |
gen. | формирование корпуса параллельных текстов | alignment (Alex_Odeychuk) |