ФОРМУЛИРУЕМ ПРОБЛЕМУ И ПОЗИЦИЮ АВТОРА — ЕГЭ 2018. Русский язык. Тренажёр. Подготовка к написанию сочинения — ЕГЭ 2018
ЕГЭ 2018. Русский язык. Тренажёр. Подготовка к написанию сочинения
ФОРМУЛИРУЕМ ПРОБЛЕМУ И ПОЗИЦИЮ АВТОРА
Данное пособие является первой частью трёхчастного комплекса пособий, предназначенных для обучения написанию сочинения на Едином государственном экзамене по русскому языку. В этой части собраны тексты и задания, которые помогут учащимся научиться выделять и формулировать проблему, поставленную в предложенном тексте, и определять и формулировать позицию автора по данной проблеме.
Чтобы сформировать устойчивые навыки по определению проблемы и позиции автора, необходимо йроанализировать большое количество текстов. Поэтому мы предлагаем начинать эту работу в 10 классе и проводить её на материале небольших текстов (мини-текстов). Небольшой объём таких текстов позволяет проанализировать достаточно много материала, затратив на это не очень большое количество времени.
Наше пособие содержит материал для такой работы. Оно представляет собой мини-тексты и набор стандартных заданий к ним, помогающих учащимся прежде всего научиться определять и формулировать проблему, поставленную автором в тексте. Как известно, это умение — одно из самых важных на экзамене.
Задания, которые мы предлагаем, способствуют выработке устойчивых умений у учащихся. Прежде всего мы советуем, прочитав текст, пересказать его. В процессе пересказа становится ясно, насколько верно ученик понял содержание, а что прошло мимо его внимания. В качестве вывода рекомендуется после пересказа сформулировать тему текста, т.е. определить, о чём говорится в тексте. Оформить это удобнее в виде конструкции «В тексте говорится о…».
Затем можно выполнить несколько заданий, которые помогут точнее сформулировать проблему.
Рекомендуется выполнить задание на различение публицистического и художественного текстов, т. к. это связано со способом постановки проблемы и способом выражения авторской позиции. Если в публицистических текстах проблема и позиция автора выражаются, как правило, однозначно, незавуалированно, то в художественных текстах нужно учитывать наличие героя-рассказчика или героя-резонёра в прозе и лирического героя в стихотворениях. Однако это задание мы считаем факультативным, так как иногда бывает трудно определить стиль текста (если это, например, художественная публицистика, как в книге В. Солоухина «Камешки на ладони»). Поэтому данное задание можно выполнять там, где это существенно влияет на понимание текста.
Заданиями, связанными с пониманием и точной формулировкой проблемы, являются также задание по определению типа речи (это важно и для формирования умения выполнять задание 21 в первой части ЕГЭ) и задание по оценке предлагаемого предложения с точки зрения соответствия его содержанию текста (аналогично заданию 20 в первой части ЕГЭ).
Таким образом, выполнив все эти задания, ученик должен разобраться в содержании текста для того, чтобы сформулировать главное — поставленную в тексте проблему.
Мы рекомендуем начинать работу по нахождению проблемы с определения главной мысли текста, т.е. авторской позиции. Затем ученик формулирует проблему в виде вопроса к этой главной мысли, ведь авторская позиция и есть ответ на вопрос, поставленный автором. Такая пара «ответ — вопрос»/«вопрос — ответ» делает рассуждения ученика логичными и не позволяет подменить существующую проблему сходными. Конечно, формулировать проблему можно и с помощью конструкции «Проблема + сущ. в форме р.п.», однако в этом случае формулировки получаются более широкими по смыслу, и ученик в процессе работы над сочинением может изменить заявленный вначале аспект проблемы. Чтобы этого не произошло, мы предлагаем начинать всё-таки с вопроса к позиции автора (это более конкретная формулировка проблемы), а затем при желании переходить к более широкой формулировке.
В некоторых текстах возможно выделение нескольких проблем. Ученик имеет право сформулировать любую из них.
В Ответах (III часть пособия) даны примерные формулировки проблем и позиции авторов. В работах учащихся, естественно, формулировки могут быть иными.
Во II части пособия представленные ранее тексты даны с пропусками букв и знаков препинания. В этом случае тексты можно использовать для повторения орфографии и пунктуации.
В общей схеме экзаменационного сочинения (созданной с опорой на задание 25 и на Критерии оценивания задания с развёрнутым ответом) данная часть комплекса помогает учащимся научиться писать следующие части работы (выделено жирным):
Схема сочинения1
I. Вступление.
II. 1. Формулировка проблемы.
2. Комментарий к проблеме.
3. Позиция автора по проблеме.
4. Позиция ученика по проблеме.
5. 1-й аргумент.
6. 2-й аргумент.
III. Заключение.
Предложенные нами тексты содержат проблемы, которые часто встречаются в экзаменационных текстах, поэтому их можно использовать и в качестве текстов-аргументов для подтверждения своей позиции по подобным проблемам. Для того чтобы систематизировать тексты по проблемам, можно воспользоваться таблицей, данной в приложении.
Мы надеемся, что наше пособие поможет и учащимся, и их преподавателям в процессе подготовки к ЕГЭ по русскому языку.
1 Приведённая схема сочинения является примерной.
Подготовка к ЕГЭ-2020 по русскому языку в Перми
Расскажите о своей задаче
Ответьте на несколько вопросов, чтобы увидеть больше подходящих репетиторов.
НачатьОтклики
Получать новые отклики
121 репетитор1700 отзывовСредняя оценка 4,7Средняя цена 533
ЕГЭ по русскому языкуБыла на сайте больше недели назад
Пригласить
Имею большой опыт репетиторства, хорошие отзывы клиентов. Большинство учеников — 9−11 классы.
Возможна дистанционная работа (ZOOM).
У себя:
Ленинский- Старший преподаватель кафедры методики преподавания русского языка и литературы ПГГПУ · 1975–2014 гг.
- Репетиторский опыт · с 2000 г. (21 год)
- На сервисе с сентября 2014 г. (7 лет)
6 августа 2021, Тамара:
Русский язык, ЕГЭ по русскому языку
Ещё 31 отзывПригласить
Была на сайте больше недели назад
У себя:
ЛенинскийБыла на сайте сегодня в 16:58
Пригласить
Педагог-провокатор: никаких авторитетов, все через спор и практический опыт. Сначала взаимопонимание, потом работа по предмету. Ежегодно примерно 30% моих учеников набирают больше 90 баллов на ЕГЭ по русскому языку, но такой результат возможен только при желании ученика, заставлять учиться я не умею.
У себя:
Дзержинский, Ленинский- Педагогический стаж (общеобразовательная школа, институт повышения квалификации, центр дополнительного образования) · с 1998 г. (23 года)
- Репетиторская деятельность · с 1998 г. (23 года)
- На сервисе с февраля 2012 г. (9 лет)
3 августа 2021, Татьяна Николаевна:
Русский язык, ЕГЭ по русскому языку
Ещё 66 отзывовПригласить
Была на сайте сегодня в 16:58
У себя:
Дзержинский, ЛенинскийКак найти репетитора
- Укажите свой предмет и ответьте на несколько уточняющих вопросов
- Подождите откликов репетиторов и обсудите с ними условия в чате
- Обменяйтесь контактами и договоритесь о начале занятий
Была на сайте сегодня в 16:29
Пригласить
Большой опыт подготовки к ЕГЭ, ОГЭ и другим экзаменам по русскому языку и литературе. Высокие показатели учеников (80−100 б). Работаю в центре города, в отдельном офисе с 10 до 21.00. Можно индивидуально или в группе из 2−3 человек. Очные и дистанционные занятия на любой платформе.
Скидка25 %На занятия в паре.
У себя:
Ленинский- Репетиторская деятельность · с 1989 г. (32 года)
- Педагогический стаж – 9 лет (общеобразовательная и частная школы, репетиторский центр)
- На сервисе с марта 2010 г. (11 лет)
24 июля 2020, Мария Морозова:
Мне очень понравилось работать с Еленой Николаевной!Отзывчивый и квалифицированный специалист:)
Мы разобрали в сочинении все мои проблемы,разбирали вопросы по поводу первой части.У меня сложилось только хорошее впечатление от сотрудничества с Еленой Николаевной.Получила 91 балл на ЕГЭ,но тут только моя вина из-за невнимательности и суеты.Спасибо большое,Елена Николаевна,что согласились со мной заниматься!С вами было интересно и приятно работать!Благодаря вам садилась за работу с удовольствием и желанием узнавать что-то новое,а страх перед экзаменом исчезал 🙂
Русский язык, ЕГЭ по русскому языку
Ещё 139 отзывовПригласить
Была на сайте сегодня в 16:29
У себя:
ЛенинскийБыла на сайте вчера в 16:24
Пригласить
Большой опыт. Хорошие результаты. Репетиторством занимаюсь давно и люблю эту работу. Люблю и знаю русский язык и литературу. Доброжелательна.
У себя:
Мотовилихинский, Свердловский- Опыт преподавания – 32 года (школа, колледж, ВУЗ, курсы)
- Опыт репетиторства – 20 лет
- На сервисе с ноября 2011 г. (10 лет)
2 августа 2021, Мария Эдуаодовна:
Моей дочери она понравилась,доходчиво объясняет, спокойная, литература, экзамен сложный,дочь сдала ЕГЭ неплохо
Литература, русский язык, ЕГЭ по русскому языку
Ещё 109 отзывовПригласить
Была на сайте вчера в 16:24
У себя:
Мотовилихинский, СвердловскийБыла на сайте больше недели назад
Пригласить
Всегда хорошие и отличные результаты.
Подготовка к ОГЭ и ЕГЭ по русскому языку учеников 9−11 классов: занятия по авторской методике индивидуально и в малых группах.
Скидка25 %Снижаю стоимость всего обучающего курса до 25%, если ученик согласен заниматься в паре или мини-группе.
У себя:
Ленинский- Опыт преподавания (частная гимназия, вуз, репетиторство) · с 1997 г. (24 года)
- Репетиторский опыт с 1997 года · с 1997 г. (24 года)
- На сервисе с июля 2010 г. (11 лет)
5 марта 2018, Людмила:
Юлия Николаевна занимается с Максимом всего месяц, поэтому судить о результатах пока сложно. Занятия Максиму нравятся, мы уверены, что результат будет. Сын занимается с удовольствием.
Русский язык, ЕГЭ по русскому языку
Ещё 29 отзывовПригласить
Была на сайте больше недели назад
У себя:
ЛенинскийПопробуйтеавтоматический поиск
Просто расскажите о своей задаче — и подходящие репетиторы вам напишутНайти репетитораБыла на сайте 3 дня назад
Пригласить
Добрый день, предлагаю помощь в подготовке сдачи итоговой аттестации по русскому языку и литературе (ОГЭ, ЕГЭ). Также помогаю ребятам средней школы повысить знания по русскому языку, литературе. Доступно объясняю сложный школьный материал. Устраняю пробелы в знаниях. Преподавательский и репетиторский опыт более 5 лет.
У себя:
Индустриальный- Репетитор · с 2011 г. (10 лет)
- Преподаватель в финансово-экономическом колледже · с 2014 г. (7 лет)
- На сервисе с января 2017 г. (4 года)
14 июля 2019, Виктория:
Русский язык, ЕГЭ по русскому языку
Ещё 8 отзывовПригласить
Была на сайте 3 дня назад
У себя:
ИндустриальныйБыла на сайте сегодня в 14:49
Пригласить
Доходчиво объясняю материал. Использую дополнительные знания по предмету. Люблю детей и стараюсь, чтобы занятия были интересными.
У себя:
Кировский- Педагогический опыт – 28 лет (преподаватель начальной школы, русского языка и литературы в средних школах)
- Репетиторская деятельность – более 25 лет
- На сервисе с декабря 2008 г. (13 лет)
20 сентября 2020, Варвара:
Все было отлично! Преподаватель замечательная — добрая и отзывчивая. Результатами по экзамену довольна.
Русский язык, ЕГЭ по русскому языку
Ещё 73 отзываПригласить
Была на сайте сегодня в 14:49
У себя:
КировскийБыла на сайте вчера в 15:11
Пригласить
Помогу повысить уровень знаний и ликвидировать пробелы по русскому языку и литературе, объясню доступно любой материал по данным дисциплинам, подготовлю к выпускным и вступительным экзаменам (ОГЭ, ЕГЭ и др.).
У себя:
Свердловский- Репетиторская деятельность с 1997 года · с 1997 г. (24 года)
- Педагогический стаж, в настоящее время преподаёт русский язык и литературу в школе-интернате для детей с нарушением зрения · с 1998 г. (23 года)
- На сервисе с декабря 2016 г. (5 лет)
9 июля 2019, Светлана:
Литература, русский язык, ЕГЭ по русскому языку
Ещё 9 отзывовПригласить
Была на сайте вчера в 15:11
У себя:
СвердловскийТак вы ещё долго можете листатьПопробуйте наш автоматический поиск. Просто ответьте на несколько вопросов о вашей задаче и дождитесь ответов подходящих репетиторов
Найти репетитораБыла на сайте сегодня в 16:06
Пригласить
Только дистанционно
- Опыт преподавания (преподаватель русского языка и литературы в средней школе) · с 1995 г. (26 лет)
- Опыт репетиторства · с 2008 г. (13 лет)
- На сервисе с сентября 2013 г. (8 лет)
20 июля 2017, Лариса Николаевна:
Русский язык, ЕГЭ по русскому языку
Ещё 42 отзываПригласить
Была на сайте сегодня в 16:06
Только дистанционно
Была на сайте вчера в 07:44
Пригласить
Люблю свою работу.
У себя:
Ленинский- Опыт преподавания (школы) · 1996–2007 гг.
- Репетиторский опыт · с 2000 г. (21 год)
- На сервисе с августа 2014 г. (7 лет)
17 июня 2021, Мария:
Спасибо большое Ольге Александровне !Грамотный и вежливый педагог ! С ней я получила 92 балла за ЕГЭ по русскому языку !
Русский язык, ЕГЭ по русскому языку
Ещё 72 отзываПригласить
Была на сайте вчера в 07:44
У себя:
Ленинскийвариант 8 Публикация на Педагогический портал Тривиум ( ЕГЭ русский язык, PDF Free Download
ЕГЭ: задание 26 (тест 2)
Задание 1 4440 Показать текст (А.П. Владимиров) «Автор, рассказывая историю своего героя, использует разнообразные средства выразительности, которые усиливают эмоциональное воздействие на читателя. Это
ПодробнееМониторинговые исследования
РУССКИЙ ЯЗЫК 5 КЛАСС (Вариант 01 1/5) Мониторинговые исследования по РУССКОМУ ЯЗЫКУ Вариант 01 Инструкция по выполнению работы В работе по русскому языку две части. Выполнять задания каждой части можно
ПодробнееИнструкция по выполнению работы
Русский язык. 9 класс 1 Инструкция по выполнению работы На выполнение экзаменационной работы по русскому языку даётся 4 часа (240 минут). Работа состоит из 3 частей. Часть 1 включает 1 задание (С1) и представляет
ПодробнееИнструкция по выполнению работы
Демонстрационный вариант краевой диагностической работы 2 по РУССКОМУ ЯЗЫКУ для учащихся 11 классов и 12 классов вечерних ОО (январь 2019 г.) Инструкция по выполнению работы Краевая диагностическая работа
ПодробнееЭкзаменационная работа
Экзаменационная работа для проведения государственной (итоговой) аттестации выпускников IX классов общеобразовательных учреждений 2008 года (в новой форме) по РУССКОМУ ЯЗЫКУ Район Город (населенный пункт)
Мониторинговые исследования
РУССКИЙ ЯЗЫК 5 КЛАСС (Вариант 02 1/5) Мониторинговые исследования по РУССКОМУ ЯЗЫКУ Вариант 02 Инструкция по выполнению работы В работе по русскому языку две части. Выполнять задания каждой части можно
ПодробнееРУССКИЙ ЯЗЫК И КУЛЬТУРА РЕЧИ
Департамент образования Вологодской области БПОУ ВО «Великоустюгский политехнический техникум» ЗАОЧНОЕ ОТДЕЛЕНИЕ ЭКЗАМЕНАЦИОННЫЕ ВОПРОСЫ ПО ПРЕДМЕТУ: РУССКИЙ ЯЗЫК И КУЛЬТУРА РЕЧИ 2 курс По специальности:
ПодробнееМосква учебный год
Москва 2017-2018 учебный год Экзаменационный словарь ГИА государственная итоговая аттестация, экзамен, предполагающий определенную процедуру проведения. ЕГЭ единый государственный экзамен, форма государственной
ПодробнееКонтрольная работа 10 класс Часть 1
Контрольная работа 10 класс Часть 1 Ответами к заданиям 1 24 являются слово, словосочетание, число или последовательность слов, чисел. Запишите ответ в поле ответа в тексте работы, а затем перенесите в
ПодробнееЗадание 8 и 11: кто в доме хозяин?
Задание 8 и 11: кто в доме хозяин? Конечно, мы, учителя, знаем, что для вас, учеников, очень важно хорошо сдать ОГЭ по русскому языку. Было бы просто наивно полагать, что главная мотивация каждого из вас
ПодробнееЭксперт рассказал, как написать сочинение на ЕГЭ по русскому языку
Что изменилось в этом году?
Уточнена формулировка задания, серьезно сместились акценты: участнику ЕГЭ теперь важно в первую очередь опираться на текст, который представлен в самом задании. Ссылаться на прочитанные ранее произведения по-прежнему можно, но уже не обязательно.
Тексты составлены разработчиками на достаточно широкий круг тем (человек и природа, патриотизм, творчество и т. д.). Но конкретный перечень проблем заранее неизвестен ученикам.
Что конкретно требуется в сочинении?
Объем — не менее 150 слов.
«Напишите сочинение по прочитанному тексту. Сформулируйте одну из проблем, поставленных автором. Прокомментируйте сформулированную проблему. Включите в комментарий два примера-иллюстрации из прочитанного текста, которые важны для понимания проблемы исходного текста. Поясните значение каждого примера и укажите смысловую связь между ними. Сформулируйте позицию автора. Выразите свое отношение к позиции автора по проблеме исходного текста и обоснуйте его».
Казалось бы, задание понятно. Но, чтобы выполнить его на максимальный балл, надо очень постараться. Это самый сложный вид работы для участников ЕГЭ 2019 года.
Алгоритм-подсказка
1. Выбрать проблему (даже если кажется, что ее в тексте нет, все равно нужно постараться сформулировать). Например, это может быть проблема значимости для человека какого-либо явления.
2. В тексте отметить фрагменты, которые имеют отношение к проблеме.
3. Выделить в них две мысли, которые помогут понять суть проблемы (это будущие два примера).
4. Понять, как соотносятся два этих примера (обобщение, следствие, противопоставление…).
5. Найти предложение, которое станет связкой для двух примеров.
6. Оформить комментарий поможет формула:
(пример + пояснение) Х 2 = какая связь есть между ними
Что еще нужно помнить?
Совет № 1. Обосновывая собственное мнение, приводите пример из жизненного или читательского опыта. Если же просто сослаться на какой-либо текст, не устанавливая причинно-следственных связей, то это не будет обоснованием мнения.
Совет № 2. Старайтесь быть оригинальным, не повторять одни и те же мысли по нескольку раз в разных частях сочинения.
Совет № 3. Обосновать свою позицию — значит подкрепить доказательствами, привести убедительные доводы. То есть, по сути, нужно привести другое суждение, логически связанное с выдвинутым тезисом и подтверждающее его.
Полная версия материала на портале ГодЛитературы.РФ
Суд лишил Днепропетровскую область русского языка
Фото: Dmytro Smolyenko/Keystone Press Agency/Global Look PressДнепропетровский окружной суд лишил статуса регионального русский язык в Днепропетровской области на Украине. Постановление было принято 13 августа, в силу оно вступит по истечении срока подачи апелляции, сообщает «Левый берег».
Такие же решения уже были приняты в Запорожье, Харькове и Николаеве.
Признать противоправным и недействительным с 28 февраля 2018 года решение Днепропетровского областного совета «О поддержке языковой политики на Украине» № 333-14/VI от 17 августа 2012 года, — сказано в решении суда.
В 2012 году на Украине был принят закон об основах языковой политики, который позволял наделять отдельные языки статусом региональных. На них можно было вести делопроизводство, получать образование, использовать такой язык в культуре. На тот момент русский язык был признан региональным в 13 из 27 субъектов Украины.
Однако в 2014 году положения закона об основах языковой политики упразднили, а в 2018 году закон и вовсе был признан неконституционным. С 2019 года в стране действует новый закон, согласно которому единственным государственным языком считается украинский.
Ранее сообщалось, что русский язык следует переименовать в «московский», так как это его «исторически правильное название». Об этом заявила украинская писательница Лариса Ницой. По её словам, Россия «стырила» у Украины название русского языка, который для многих жителей Украины является привычкой, а не необходимостью.
Добавить наши новости в избранные источники
Максим Шевченко надеется на «слово пацана»
Максим Шевченко, лидер Российской партии свободы и справедливости (РПСС), рассказал, какой процент он рассчитывает получить в Татарстане на выборах в Госдуму и почему его партию нельзя назвать ни левой, ни спойлером. При этом Шевченко открыто ностальгирует по колхозам, отвергает идею частной собственности и оправдывает голосование за «Единую Россию». По крайней мере, в национальных республиках.
И это далеко не все парадоксы, которые можно было обнаружить в выступлении лидера РПСС перед журналистами и потенциальными избирателями в конференц-зале отеля Ibis.
Начать с того, что визит Максима Шевченко в Казань не был омрачён ни провокациями, ни внезапными отменами бронирования зала «по техническим причинам» — хотя сам лидер РПСС в выступлении успел посетовать, что власть партию «открыто побаивается» и не даёт доступа к медиа, скрывая и блокируя информацию о новом политическом игроке.
Между тем, «нежелательные» оппозиционеры в Казани как раз довольно часто сталкиваются с разного рода препятствиями. Достаточно вспомнить визит в Казань лидера партии ПАРНАС Михаила Касьянова в 2016-м, внезапный отказ гостиницы «Волга» в аренде зала Школе местного самоуправления в 2019-м, показательный разгром штабов «Объединенных демократов» в Казани в 2020-м…
Фон в провластных СМИ, вызванный визитом Шевченко в Казань, тоже едва ли можно назвать негативным. На сайте ТНВ висит анонс большого интервью Шевченко телеканалу. На заглавном фото политик позирует с Ильшатом Аминовым, директором телекомпании и депутатом Госсовета РТ нескольких созывов, который этим летом оскандалился, сравнив россиян с баранами и коровами в эфире той самой передачи, очередным гостем которой стал Максим Шевченко.
«ПУТИН, ИЗ КАКИХ ДЕНЕГ ТЫ 10 ТЫСЯЧ ВЗЯЛ?»Встреча с потенциальными избирателями и прессой в отеле Ibis тоже прошла на удивление ровно. Ни колких шпилек, ни каверзных вопросов не прозвучало. В зале собрались главным образом представители ВТОЦ и сторонники организации — большой блок своего выступления Шевченко посвятил именно федерализму и языковому вопросу:
— Борьба за язык — один из форматов борьбы за гражданские свободы. За право человека оставаться человеком. Мы сами между собой разберёмся, кто там был прав — Иван Грозный или Сююмбике, Золотая Орда или Московское Царство… Не они должны нам указывать: «Учебник может быть такой — и не может быть другой», «Язык должен быть такой, а другой — это только культурный феномен». Нет, мы выступаем за Российскую Федерацию, в которой регионы сами выбирают культурную компоненту своего региона…
Фотогалерея:Максим Шевченко в Казани: о партиях-спойлерах, заслугах ЕР и преимуществах колхозов
И политика ассимиляции, уничтожения вот этого права людей быть теми, кем они хотят — она абсолютно неприемлема. Это сознательное превращение нашей страны из территории свободных людей в территорию, которая будет уподоблена какой-нибудь колониальной Ост-Индийской компании. Правящая верхушка очень хорошо устроилась. Она контролирует добычу полезных ископаемых и продажу за границу… Деньги получить оттуда, перевести опять туда… и по остаточному принципу что-то нам. Десять тысяч, пятнадцать тысяч… Пенсионерам — десять тысяч! Вопрос: Путин, а из каких денег ты эти десять тысяч взял? Что это за бюджетная статья расходов? Можно как-то отчитаться? Он — царь? У него казна какая-то? Свои золотые монеты? Это его личные деньги?
Они просто хотят тирании и диктатуры, в которых попы будут ходить и говорить «Бог так сказал, что вы должны быть главными» Так будут говорить попы христианские, исламские — какие угодно. Может, только еврейские попы говорить не будут, потому что они хитрые и умные. Так будут говорить все! Шаманы даже собрались в Якутии, осудили Габышева Александра, который шёл «изгонять из Кремля злые силы», сказали, «нет, мы, шаманы, поддерживаем федеральную власть, очень правильно всё делают». А что остаётся нам? Только гражданская консолидация. И борьба за гражданские права, за язык — важнейшая на сегодня форма гражданской консолидации.
Вот поэтому, подытожил Шевченко, и была создана РПСС.
«СИДЕЛИ ПО ДОМАМ КАК ДУРАКИ ПОСЛУШНЫЕ»— А почему вы, Дамир Мавлеевич, человек академический, учёный, вдруг вот решили пойти в политическую борьбу? — обратился политик к сидящему по правую руку от него историку Дамиру Исхакову, который тоже входит в думский список партии.
— Мы в своё время создали «Демократический конгресс народов России», — рассказал Исхаков. — Там Максим активно участвовал, я тоже к ним примкнул. Нас за это сильно невзлюбили. Наших башкирских братьев даже преследовали за это, организация «Башкорт» была уничтожена фактически, но мы всё равно смогли сказать своё слово. Даже если нас тогда победили, народ стал задумываться, что вообще происходит. На наших глазах была разрушена национальная система образования…
Мы были в Москве, и к нам подошла группа татар московских. Они показали нам письмо на имя Собянина и ответ на это письмо. Они просят обеспечить преподавание родных языков. Ответ такой: у нас нет возможности. Ну как условий? Мы налогоплательщики, мы вас содержим! Это наши деньги — и вы должны выделить нам наши же деньги на преподавание родных языков.
Это означает, что государство действует против своих граждан! Они ссылаются на норму закона — а там такая формулировка хитрая: если условий нет, то невозможно. Но если условий нет — создайте! Для чего вы там сидите, для чего мы вас кормим, в конце концов?.. Я считаю, мы сильно потеряли федерализм, очень сильно. Фактически РФ сейчас только формально называется федеративной страной. А эта дурацкая идея всех собрать в агломерации? Это же есть муравейник!
— Уничтожение земли, — вклинился Шевченко. — Зачистка земли от народов, которые здесь живут. Превращение в городские люмпены, которыми легко управлять с помощью кредитов, микрокредитов, ипотек, запретов. Вот вас сейчас тренировали, как можно обращаться с людьми, как с дрессированными животными: «Всем сидеть дома! Кто вышел на улицу — тому штраф!»
— Поди, такое сельскому жителю скажи. Ему надо кормить животных, у него лес рядом есть, — рисовал идиллическую картину сельской жизни лидер РПСС. — А в городах… Вот они хотят Москву 45 миллионов сделать. 45 миллионов людей, которые будут подчиняться жандармско-полицейскому… Ну прямо скажем, фашистскому режиму, первую пробу которого мы с вами увидели в прошлом году, во время так называемых социальных запретительных мер. Которые касались нас, граждан, в то время как несчастные толпы трудовых мигрантов ходили по Москве без масок, без всего, работали за нас.
Мы сидели по домам, как дураки, послушные, запуганные — а они ходили, болели, умирали, распространяли инфекцию. Потому что они как бы выкинуты [из социума]… А наши леса, наши села, деревни, наши маленькие города?.. Мёртвые! А вся эта земля принадлежит крупному финансовому капиталу.
(насколько вольготно на самом деле чувствуют себя колхозники в том же Татарстана независимые СМИ писали не раз; вот и вот, например, две вполне красноречивые истории из жизни сельских тружеников — «Idel.Реалии»)
КОЛХОЗ КАК «ЕСТЕСТВЕННАЯ ФОРМА» ТРУДАДальше Максим Шевченко решил раскритиковать саму идею частной собственности.
— Они же, покупая эти огромные миллионы гектаров земли, говорят: «Частная собственность — это священно». С какой стати это священно? — усмехнулся политик. — Это западная протестантская концепция, которая нам навязывается.
— У нас татарские сёла сейчас в более-менее хорошем состоянии, но если мы останемся без земель — у нас и республики не будет, — поделился прогнозом Дамир Исхаков. — Если всех соберут в агломерации, действительно, как говорят татары, превратимся в городских воробьёв и будет контроль над нами над всеми. А когда ты имеешь земельные угодья, пусть даже небольшие, десять соток, ты с голоду не помрёшь. Поэтому землю мы ни в коем случае отдавать не должны. В нормальных странах, если ты будешь пытаться купить землю муниципалитета, там десять этажей преград есть, чтобы на сторону не продавать.
— Достаточно проехать из Татарстана в Нижегородскую, Ярославскую, Владимирскую область, чтобы посмотреть, как они заботятся о русском народе. Как они отняли у него главный инструмент жизни народа — землю, продали это всё в частную собственность, — сокрушался Шевченко. — Как закрыты и разорены естественные формы коллективного труда, которые возникали — колхозы, совхозы, которые можно было модернизировать. Первый их указ был, когда они пришли к власти — они сразу начали уничтожать социально-экономическую базу!..
Чудом Татарстан не пошёл… Ну, не чудом на самом деле. Это же была воля, что вы не пошли по этому пути? — Минтимер Шарипович — наш первый президент, который аграрные дела хорошо знал, сам выходец с села, он торпедировать не стал, — дипломатично согласился Исхаков. — Хотя у нас тоже прошли отрицательные реформы, нельзя сказать, что создано очень хорошее сельское хозяйство с фермерами, у нас тоже крупные корпорации возникли… Но кое-где у нас старые формы хозяйствования остались — колхозы во многих районах есть.
— Потому что главный смысл существования государства должна быть ни хрена никакая не экономическая целесообразность! Не прибыльность и не рациональность, а человек. Че-ло-век! — по слогам отчеканил Шевченко. — Нам предстоит большая борьба. Партию «Свобода и справедливость» будет легко узнать в бюллетене. Черный квадрат с белой звездой. Перепутать невозможно, мы выделяемся на фоне этих всех серых бесцветных значков, которые там будут. Мы говорим то, что думаем, мы никого не боимся, мы выступаем за политзаключенных.
Мы не левые, мы не правые. Мы считаем, что это политические вопросы, с которыми потом можно будет разобраться, если они будут актуальные. Мы — граждане.
— Мы всецело согласны с вашими устремлениями. Но при нынешней системе как это можно достигнуть? — задалась вопросом Энже Даутова, член ВТОЦ. — Мы же все знаем, как проходят выборы. Мы приходим на избирательные участки, ну а куда наши голоса деваются, не нам вам рассказывать.
— Конечно, мы ни одной секунды не верим, что будут честные выборы. Но значит ли это, что мы должны опустить руки? Мы боремся не ради того, чтобы занять какие-то кресла… У нас такие возможности были. Есть такой феномен: чем выше явка, тем сложнее фальсифицировать. Они опускают явку специально, чтоб люди не ходили.
Чтобы число явки приблизилось к числу бюджетников. Если явка будет 70 процентов, сфальсифицировать практически невозможно. Конечно, такой явки сейчас не будет. Они прогнозируют в районе 35%. Наша партия, мы выступаем, чтобы каждый гражданин обязан был голосовать. Пусть каждый привезёт 50 человек, возьмёт на себя такое соцобязательство. Смотрите, что произошло в прошлом году в Беларуси, мы же все это видели: Александр Лукашенко с треском проиграл выборы. Он думал, что белорусам всё равно. Да, там реально социальное государство, гораздо лучше, чем в России. И он думал, что люди довольны властью. Но выяснилось, что он им просто надоел. Батька, который часами говорит. Ну просто надоел. Люди внезапно встали — и пришли к избирательным участкам. Они на это не рассчитывали. Поэтому все протоколы — что? Правильно, сожжены. В итоге — катастрофа, паника. Надо было народ дубинками избивать и во весь этот кошмар, который год продолжался, Белоруссию окунуть. Давайте сделаем также. Чтобы у нас очереди были у избирательных участков. Они на это не рассчитывают совершенно. Получится — не получится, другой вопрос. Каждый пусть приведёт по 50 человек на избирательный участок. Это уже шок! Представляете, в Казани непонятно что! Давайте превратим выборы в референдум о вотуме доверия федеральной власти.
«НАСТОЯЩАЯ ПОЛИТИЧЕСКАЯ ПРОСТИТУЦИЯ»Уже отвечая на вопросы журналистов, Максим Шевченко раскритиковал идею умного голосования:
— Цель умного голосования — чтобы прошёл любой кандидат, кроме кандидата от «Единой России». Так это сформулировано. Мне кажется, это заведомо ложная цель. Кандидаты многих так называемых оппозиционных партий — КПРФ, ЛДПР — это та же «Единая Россия». Которые будут точно так же себя вести. И мы это прекрасно понимает. Не хочу называть персоналий, но какая разница по большому счёту между некоторыми депутатами Госсовета РТ от КПРФ и депутатами Госсовета от ЕР?
Потом, это персонально. И от «Единой России» идут в разных регионах ребята — порядочные, нормальные люди, которые защищают нормальных людей. Какая цель «Умного голосования»? Чтобы в Думу прошли какие-то там шестьдесят человек — и потом Леонид Волков или Алексей Навальный из ШИЗО скажут «Они прошли благодаря нам» и представят это в Европейском союзе, что мы имеем своих кандидатов? Это подразумевает, что мы должны нравиться Волкову, Навальному. Я не собираюсь ни перед кем заискивать, я считаю Алексея Навального политическим заключенным, требую, чтобы были сняты уголовные дела с Любови Соболь, Киры Ярмыш и многих других, они ни в чем не виноваты — но заискивать перед ними я никогда не буду.
На вопрос, как Шевченко относится к тому, что РПСС называют спойлером, политик отреагировал наиболее эмоционально. Хотя и начал с сарказма.
— Ну да, я понимаю, что Дамир Исхаков, Руслан Курбанов, Руслан Айсин — это известные сталинисты, которые конечно же являются спойлером крупного деятеля коммунистического движения Геннадия Зюганова и его сподвижника, верного ленинца Юрия Афонина… Спойлер — тот, кто имитирует другого. Пусть кто-то скажет, в каком смысле какую партию мы имитируем. Вот у какой партии есть чёрный цвет? — обратился к партийной символике Шевченко. — Мы — единственные!
— А что он означает?
— Чёрный цвет содержит все цвета. Цвет свободы. Наше знамя — цвета ночи.
— Знамя Пророка тоже было чёрное в начале, — успел вставить ремарку Дамир Исхаков.
— Поэтому тем, кто называет нас упорно и тупо спойлерами… Давайте разберёмся, кто спойлер. Допустим, в Петербурге местное отделение КПРФ подало в суд на РПСС, пытаясь снять нас с выборов. В интересах «Единой России»… Подать в суд на РПСС, доказывая, что у нас не той ручкой поставлены подписи, не тем цветом?.. Это как называется? Это уже не спойлерство. Это называется стукачество и б… — употребил непечатное слово, которым обычно характеризуют крайнюю половую распущенность, Шевченко. — Это и есть самая настоящая политическая проституция. А как это ещё назвать? Когда у вас Грудинина, например, снимают с выборов, мы заступаемся за Грудинина, за членов других партий. Мы считаем, что развитие политической системы состоит в дискуссии. А здесь мы видим что? Прислуживание политическим хозяевам. Я не говорю за всех членов КПРФ, но я три года будучи союзником КПРФ изучил региональную политику и прекрасно знаю, как в каком регионе местное отделение КПРФ, например, строит свои отношения с региональными властями.
Политик добавил, что левой партией РПСС не считает:
— Я считаю КПРФ главной партией на левом фланге. Мы не на левом фланге находимся. У нас Дамир Мавлеевич, я не знаю…
— Социал-демократ, — рассмеялся Дамир Исхаков.
— Руслан Курбанов — мусульманин, живёт по Шариату… У нас разные люди, мы — гражданская коалиция… Поэтому те, кто нас оскорбляет, либо делают это по приказу своих хозяев, либо идиоты. Другого нет у меня для них слова.
«Я ЗА ТЕБЯ ГОЛОСОВАТЬ НЕ СТАНУ!»Слушатели соглашались с Исхаковым и Шевченко практически во всём, но один раз всё же дошло до эмоционального спора.
— В татарские школы детей не отдают, потому что ЕГЭ на русском языке. Поэтому, если вы пройдёте в Госдуму, в первую очередь вы должны выступить против системы ЕГЭ! — выдвинула требование Гульфания Залялова. — Ни в одной стране ЕГЭ нет!
— Это не совсем так, — возразил Шевченко.
— Что совсем не так? — нахмурилась женщина, давшая наказ РПСС.
— Сейчас Дамир абый разъяснит.
— Вопрос далеко не простой. Я, например, за то, чтобы ЕГЭ осталось… — начал объяснять Исхаков.
— Ну тебя!
— …потому что многие мои знакомые, родственники благодаря ЕГЭ поступают в очень хорошие столичные вузы. — Репетиторов нанимают! В школах их не готовят! Хватит! — вспылила Залялова.
— Иначе они, может, и не смогли бы поступить, — настаивал учёный.
— Хватит! Не было никогда ЕГЭ для татарских школ!
— Я лично выступаю за то, чтобы ЕГЭ можно было сдавать на родных языках, не только на русском. Я поступал в университет — экзамен можно было сдавать на двух языках. Почему бы нам не вернуться к этой традиции? Но для этого закон надо менять, — пытался объяснить Исхаков.
— Ой, Алла! — вырвалось у женщины.
— Разные варианты действий есть…
— Нет никакого варианта! Я за тебя голосовать не стану! — категорично заявила Гульфания Залялова.
«МЕХАНИЗМ ЗАЩИТЫ» ДАЛ СБОЙ. ИЛИ НЕТ?Отвечая уже под самый занавес на вопросы журналиста газеты «Коммерсантъ», Максим Шевченко заявил, что ставку его партия делает всё же не на деревню, а на такие крупные мегаполисы как Москва и Санкт-Петербург. А вот прогноз по Татарстану политик сделал более осторожный.
— Сколько мы планируем получить в Татарстане? Около трёх процентов. Татарстан — очень важный регион, но мы считаем, что наши главные регионы — те, где региональные власти не могут коренным образом влиять на результаты голосования. Это Москва и Петербург, прежде всего, большие города.
Казань, естественно, тоже свободный город. Я надеюсь, что жители Казани покажут, что «слово пацана» — такая прекрасная книга есть, очень интересная (книга посвящена «казанскому феномену» — местным ОПГ, волна которых захлестнула город в 80-е и 90-е гг. — «Idel.Реалии») — оно что-то значит для Казани. Хотя я прекрасно понимаю, что ЕР, которая очевидный фаворит, для многих является представителем интересов регионов в Госдуме. Национальные республики голосуют по спискам ЕР не потому, что есть сервильность какая-то перед властью, а потому, что высокий процент ЕР позволяет национальным субъектам провести большое количество депутатов — чем больше процент, тем больше депутатов, естественно, и таким образом защищать права региона. Вот Чеченская Республика, вроде небольшой субъект, а в Думе целых шесть депутатов, которые защищают, в частности, интересы Чеченской Республики и полноценно это делают.
Я так понимаю, у всех национальных республик это — инструмент защиты своего национального компонента. Я с большой симпатией отношусь к руководству Татарстана, президенту Минниханову и наследию Минтимера Шаймиева. Вот, говорят нам, есть борьба партий. Всё сложнее. Есть ещё борьба регионов — за то, чтобы не уничтожили, не отобрали, не смяли. Три процента, при тех аспектах, что я озвучил, было бы хорошим результатом в Татарстане.
Никто из собравшихся не напомнил Максиму Шевченко, что этот инструмент защиты дал очевидный сбор в 2017-2018 гг., когда в Госдуму РФ был внесены поправки, предусматривающие «добровольное изучение» всех национальных языков, кроме русского. 11 из 16 депутатов Госдумы, избранных от Татарстана, уже в первом чтении поддержали этот законопроект. Воздержался лишь Иршат Минкин, а еще четверо депутатов по каким-то причинам не участвовали в голосовании. И лишь один из этих депутатов представлял КПРФ, все остальные прошли в Госдуму от Единой России.
❌Если ваш провайдер заблокировал наш сайт, скачайте приложение RFE/RL на свой телефон или планшет (Android здесь, iOS здесь) и, выбрав в нём русский язык, выберите Idel.Реалии. Тогда мы всегда будем доступны!
❗️А еще подписывайтесь на наш канал в Telegram.
Для всех, кто умеет писать по-русски
13 апреля 2019 года состоится масштабное образовательное мероприятие «Тотальный диктант». Сотни тысяч людей в России и за рубежом собираются проверить свою грамотность. Не все знают, что у Total Dictation есть «младший брат» — тест TruD. Он создан специально для тех, кто изучает русский язык как иностранный, двуязычных детей, их родителей и всех тех, кто еще не владеет русским в совершенстве. О тесте и его первых результатах рассказала руководитель проекта «Тотальный диктант» Ольга Ребковец.
— Все мы знаем, как работает Тотальный диктант: в определенное время люди собираются в аудитории и пишут под диктовку местного жителя. Как выглядит тест TruD для иностранцев? Как они об этом узнают? Кто их собирает?
В случае с TruD принцип тот же — в определенное время люди собираются вместе, но сдают тест, а не диктант. TruD является неотъемлемой частью кампании Тотальный диктант, предназначенной для участников, изучающих русский язык как иностранный.Они узнают о кампании через социальные сети, СМИ, плакаты в учебных заведениях и т. Д. Российские учителя играют особенно важную роль, приглашая своих учеников принять участие в кампании. Вы можете проверить, доступен ли тест TruD в вашем городе, зайдя на сайт Total Dictation.Как создается TruD? Основан ли он на том же тексте, который люди пишут под диктовку? Похоже, это сложная задача, потому что Тотальный диктант тяжело переносится носителями русского языка.
Да, тест составлен на основе текста диктанта, чтобы дать участникам TruD возможность почувствовать себя частью глобального события.Ежегодно тест TruD составляют члены Экспертного совета тотального диктанта Татьяна Ивановна Белица, Ольга Михайловна Александрова из Новосибирского государственного университета и их коллега из Дальневосточного федерального университета Ирина Борисовна Череповская.
Тест обновляется ежегодно благодаря обратной связи, и его формат каждый год немного меняется. Ключевым явился переход от традиционного для школьников текста русского как иностранного с заданиями по лексике и грамматике к соревновательному формату.Все задания расположены по уровню сложности, чтобы разный уровень знаний не мешал участвовать в мероприятии. Остается последняя задача — написать под диктовку отрывок из основного текста. Эта часть не является обязательной из-за ее сложности и оценивается отдельно. Отрывок взят из текста диктанта в неизмененном виде.
— Как возникла идея такого теста и кто его целевая аудитория?
По мере развития Total Dictation люди, которые любили русский язык, но не говорили достаточно хорошо, чтобы написать длинный и сложный текст, начали проявлять интерес к мероприятию.Мы постарались изменить формат конкурса, чтобы поддержать их желание изучать русский язык, чтобы эта аудитория могла участвовать в мероприятии. Получилась живая и понятная викторина на русском языке, которая под силу как тем, кто активно изучает русский язык, так и тем, кто почти не использовал его последние двадцать лет.
TruD предназначен для всех, кто изучает русский язык как иностранный: студентов, приезжающих в российские вузы из-за рубежа; студенты зарубежных вузов, изучающие русский язык; нерусские люди с русскоязычным наследием, в том числе двуязычные дети.В случае с TruD по-прежнему актуален девиз Тотального диктанта: «Для всех, кто умеет писать по-русски».
— TruD был написан уже трижды, с 2016 по 2018 год. Можете подвести какие-то итоги? У вас отличные оценки и сколько? Какие характерные трудности возникают при написании теста?
Мы видим, что TruD был положительно воспринят участниками. Это подтверждают статистические данные: количество людей, сдающих тест, ежегодно удваивается, соревнования охватывают все большее количество стран и городов.Учителя русского языка из разных городов и стран активно присылают свои мнения и рекомендации, что особенно важно и ценно.
Мы внимательно изучаем статистику TruD, в том числе количество отличных результатов — 95 баллов и более. В 2018 году они заявлены на 8,6% от общего количества участников. Конечно, это не дает оснований для какой-либо оценки общего уровня владения языком.
В каких странах и городах TruD наиболее популярен и почему? На ваш взгляд, удалось ли тесту стать независимым брендом?
В 2018 году количество городов-участников превысило сотню и составило 133 населенных пункта в 44 странах мира.С первого же года TruD пишется на всех континентах Земли, кроме Антарктиды. Однако наибольшей популярностью тест пользуется в Азии — в Китае, Вьетнаме, Турции, Казахстане, Монголии, Сирии. Такой результат во многом стал возможен благодаря поддержке Дальневосточного отделения фонда «Русский мир», Дальневосточного федерального университета и Азиатско-Тихоокеанской ассоциации преподавателей русского языка и литературы. В Европе наибольший интерес проявляют граждане Сербии, Германии, Италии, Испании, Франции, Словакии, Болгарии и Швейцарии.Владивосток, Пермь и Челябинск стали ведущими городами России в 2018 году по количеству участников.
О том, что TruD широко признан как отдельный бренд, говорить рано, проект еще молодой. Однако уже формируется заинтересованное сообщество, и есть города, где проводится только тест, без диктанта. Мы видим, что с каждым годом количество участников увеличивается вдвое. Начали с 1069 человек, через год в TruD приняли участие 2500 человек, прошлогодний рекорд — 5250 человек.
Будут ли новшества в тесте в 2019 году и ожидаете ли вы дальнейшего роста аудитории — как по странам, так и по количеству участников?
В 2019 году главным нововведением для всего конкурса Total dictation, включая TruD, станет включение отдельного отрывка текста и соответствующего теста США. Автор диктанта 2019 года Павел Басинский уже написал текст из четырех частей. Надеемся, что в странах Южной и Северной Америки этот факт станет дополнительным стимулом для роста.Опыт показывает, что на этих континентах начинают интересоваться Тотальным диктатом и самим тестом. Сейчас мы ориентируемся не на количество участников, а на качество TruD. Такой подход приведет к увеличению интереса к тесту и мероприятию в целом. Надеемся, что в 2019 году мы сможем подарить участникам по всему миру настоящий праздник русского языка. Мир, ТруД, апрель!
404 Не найдено | Русский лингвистический вестник публикует научные статьи по языкознанию
Ключевые слова
Категория Общие вопросы, касающиеся как лингвистики, так и литературы.Филология (УДК 80) Просоды. Вспомогательные науки и источники филологии (УДК 801) Вспомогательные науки и филологические науки (УДК 801.7) Просодия: метр, ритм, рифма и стихотворный узор (УДК 801.6) Источники языкознания и филологии. Сборники текстов (УДК 801.8) Риторика. Эффективное использование языка (УДК 808) Риторика речи. Искусство или техника устного выражения (УДК 808.5) Лингвистика и языки (УДК 81) Языки (УДК 811) Все языки естественные или искусственные (УДК 811.1 / .9) Отдельные естественные языки (УДК 811.1 / .8) Индоевропейские языки (УДК 811.1 / .2) Албанский язык (УДК 811.18) Германские языки (УДК 811.11) Английский язык (УДК 811.111) Западногерманские языки (кроме Английский) (УДК 811.112) Немецкий язык (верхненемецкий, стандартный письменный немецкий) (УДК 811.112.2) Романские / романские языки (УДК 811.13) Галло-романские / галло-романские языки (УДК 811.133) Французский язык (УДК 811.133.1) Иберо-романские / иберо-романские языки (УДК 811.134) Испанский язык (УДК 811.134.2) Славянские / славянские языки (УДК 811.16) Восточно-славянские / славянские языки (УДК 811.161) Русский язык ( УДК 811.161.1) Южнославянские / славянские языки (УДК 811.163) Болгарский язык (УДК 811.163.2) Западнославянские / славянские языки (УДК 811.162) Чешский язык (УДК 811.162.3) Словацкий язык (УДК 811.162.4) Урало-алтайский, палео-сибирский, эскимосско-алеутский, дравидийский и сино-тибетский языки. Японский. Корейский язык. Айну (УДК 811.5) Сино-тибетские языки (УДК 811.58) Китайские языки (УДК 811.581) Урало-алтайские языки (УДК 811.51) Уральские языки (УДК 811.511) Финно-угорские языки (УДК 811.511.1) Методология лингвистики.Методы и средства (УДК 81-13) Специальное вспомогательное подразделение по предметным областям и аспектам лингвистики и языков (УДК 81`1 / `4) Общее языкознание (УДК 81-1) Математическая и прикладная лингвистика. Фонетика. Графема. Грамматика. Семантика. Стилистика (УДК 81`3) Прикладная лингвистика (УДК 81`33) Общая стилистика (УДК 81-38) Грамматика (УДК 81`36) Математическая лингвистика (УДК 81`32) Фонетика. Фонология (УДК 81`34) Семантика (УДК 81`37) Лингвистика текста, анализ дискурса.Типологическая лингвистика (УДК 81`4) Текстовая лингвистика. Дискурсивный анализ (УДК 81`42) Типологическая лингвистика (УДК 81`44) Теория знаков. Теория перевода. Стандартизация. Использование. Географическая лингвистика (УДК 81`2) Диалектология. Географическая лингвистика. Ареальная лингвистика (УДК 81`28) Общая теория знаков применительно к языкознанию. Семиология. Семиотика (УДК 81`22) Практическое знание языков (УДК 81`24) Психолингвистика. Психология языка (УДК 81`23) Социолингвистика.Использование языка (УДК 81`27) Теория перевода (УДК 81`25) Литература (УДК 82) Литературы отдельных языков и языковых семей (УДК 821) Специальное вспомогательное подразделение по литературным формам, жанрам (УДК 82-1 / -9 ) Специально-вспомогательное подразделение теории, изучения и методики литературы (УДК 82.02 / .09)
Автор
Поиск% PDF-1.4 % 386 0 объект > эндобдж xref 386 186 0000000016 00000 н. 0000004851 00000 н. 0000005026 00000 н. 0000006004 00000 н. 0000006073 00000 н. 0000006164 00000 п. 0000006336 00000 н. 0000006413 00000 н. 0000006527 00000 н. 0000006639 00000 н. 0000006753 00000 н. 0000006877 00000 н. 0000007023 00000 п. 0000007169 00000 н. 0000011288 00000 п. 0000014725 00000 п. 0000015148 00000 п. 0000015786 00000 п. 0000016159 00000 п. 0000016718 00000 п. 0000016837 00000 п. 0000016938 00000 п. 0000017457 00000 п. 0000018083 00000 п. 0000018454 00000 п. 0000018890 00000 н. 0000023185 00000 п. 0000027514 00000 п. 0000027656 00000 п. 0000027834 00000 п. 0000028286 00000 п. 0000034091 00000 п. 0000039910 00000 н. 0000045011 00000 п. 0000049631 00000 п. 0000054802 00000 п. 0000057629 00000 п. 0000057873 00000 п. 0000057956 00000 п. 0000058011 00000 п. 0000058096 00000 п. 0000058185 00000 п. 0000058276 00000 п. 0000058589 00000 п. 0000058627 00000 п. 0000058710 00000 п. 0000058783 00000 п. 0000059087 00000 п. 0000059266 00000 п. 0000059324 00000 п. 0000059381 00000 п. 0000059505 00000 п. 0000059583 00000 п. 0000059658 00000 п. 0000059733 00000 п. 0000059850 00000 п. 0000059999 00000 н. 0000060326 00000 п. 0000060381 00000 п. 0000060497 00000 п. 0000060621 00000 п. 0000060747 00000 п. 0000060871 00000 п. 0000060995 00000 п. 0000061111 00000 п. 0000061181 00000 п. 0000061266 00000 п. 0000064469 00000 н. 0000064757 00000 п. 0000064930 00000 н. 0000064957 00000 п. 0000065257 00000 п. 0000067701 00000 п. 0000068066 00000 п. 0000068488 00000 п. 0000069829 00000 п. 0000070149 00000 п. 0000070505 00000 п. 0000071153 00000 п. 0000071436 00000 п. 0000073468 00000 п. 0000073814 00000 п. 0000110790 00000 н. 0000110829 00000 н. 0000110851 00000 п. 0000156612 00000 н. 0000156651 00000 н. 00001
Параллельные корпуса | CLARIN ERIC
Введение
Параллельные корпуса занимают центральное место в переводческих исследованиях и сопоставительной лингвистике. Многие из параллельных корпусов доступны через простые в использовании конкордансеры, что значительно облегчает изучение межъязыковых явлений. Такие корпуса также являются богатым источником материалов для обучения языкам. Кроме того, параллельные корпуса служат в качестве обучающих данных для систем статистического машинного перевода.
Параллельные корпуса — это наше самое большое семейство ресурсов, поскольку инфраструктура CLARIN обеспечивает доступ к 86 параллельным корпусам, большинство из которых доступно для загрузки из национальных репозиториев, а также через конкордансеры, такие как Korp, Corpuscle и KonText. Инфраструктура CLARIN включает 47 двуязычных корпусов, в основном состоящих из европейских языковых пар, а также неевропейских языков, таких как хинди, тамильский и вьетнамский. 39 корпусов являются многоязычными, 5 из них содержат тексты на более чем 50 языках.Почти половина корпусов выровнена по предложениям, что позволяет легко проводить сравнительные исследования.
Сначала мы даем обзор корпусов, которые уже являются частью инфраструктуры CLARIN, а затем перечисляем те, которые еще не интегрированы.
Для комментариев, изменений существующего содержания или включения новых корпусов отправьте нам электронное письмо.
Последнее обновление веб-сайта: 10 августа 2021 г.
Параллельные корпуса в инфраструктуре CLARIN
Двуязычный корпус
Корпус | Язык | Описание | Наличие |
---|---|---|---|
Двуязычный корпус амхарско-английского Размер: 500 миллионов токенов | амхарский-английский | Этот корпус содержит юридические тексты и новостные статьи. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Каталонско-испанский параллельный корпус Размер: 100 миллионов токенов | Каталонский испанский-кастильский Испанский | Этот корпус содержит газетные статьи. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Хорватско-английский параллельный корпус hrenWaC 2.0 Размер: 99,001 пара предложений | хорватско-английский | Этот корпус содержит тексты, сканированные с хорватских доменов верхнего уровня .hr. Корпус доступен для загрузки на сайте CLARIN.Репозиторий СИ. | Скачать |
Рефераты статей ÚFAL на чешском и английском языках Размер: 200000 токенов | чешско-английский | Этот корпус содержит отрывки из статей ÚFAL. Корпус доступен для загрузки из репозитория LINDAT. | Скачать |
Чешско-английское руководство по выравниванию слов Размер: 113 000 токенов | чешско-английский | Этот корпус содержит тексты из электронных книг, Reader’s Digest, журнала Kačenka, Acquis Communautaire, Project Syndicate и проекта PCEDT. Корпус доступен для загрузки из репозитория LINDAT. | Скачать |
CzEng 1.6 Размер: 206,4 миллиона токенов | чешско-английский | Этот корпус является двунаправленным, с оригинальными текстами на английском и чешском языках и сопровождающими переводами. Корпус доступен для загрузки с специального веб-сайта. Соответствующую публикацию см. Bojar et al. (2016). | Скачать |
Чешско-словацкий параллельный корпус Размер: 5,7 млн предложений | чешско-словацкий | Этот корпус содержит юридические тексты (Acquis), парламентские дебаты (из корпуса Europarl), статьи из Официального журнала Европейского Союза и тексты из корпуса OPUS. Корпус доступен для загрузки из репозитория LINDAT. | Скачать |
Туризм, англо-хорватский параллельный корпус 2.0 Размер: 140000 токенов | англо-хорватский | Этот корпус содержит тексты с туристических сайтов. Корпус доступен для загрузки из репозитория CLARIN.SI. | Скачать |
Каченка Размер: 3,3 миллиона токенов | английский-чешский | Этот корпус содержит художественные тексты. | |
Англо-чешский корпус из Википедии Размер: 7.5 миллионов токенов | английский-чешский | Этот корпус содержит статьи из Википедии. Корпус доступен для загрузки из репозитория LINDAT. | Скачать |
Текстовый корпус — EMEL Размер: 43000 токенов | английский-французский | Этот корпус содержит документы конференций по НЛП. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Англо-греческий корпус QTLP для области МЕДИЦИНСКИЙ Размер: 62,452 пары предложений | Английский-Греческий | Этот корпус содержит медицинские тексты. | Для доступа обратитесь к менеджерам ресурсов. |
QTLP English-Greek Corpus для АВТОМОБИЛЬНОГО домена Размер: 2946 пар предложений | Английский-Греческий | Этот корпус содержит тексты из автомобильной отрасли. | Для доступа обратитесь к менеджерам ресурсов. |
Межъязыковые перспективы Размер: 18 артикулов | Английский-Греческий | Этот корпус содержит исследовательские статьи. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
форма Размер: 376250 токенов | Английский-Греческий | Этот корпус содержит статьи из журнала студенческого творческого письма на факультете английского языка в Греции. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
HindEnCorp 0,5 Размер: 132,300 предложений | английский-хинди | Этот корпус содержит выступления TED, новостные статьи, статьи из Википедии и т. Д. Корпус доступен для загрузки с LINDAT и может быть запрошен через KonText. | Конкордансер Скачать |
Англо-словацкий параллельный корпус Аннотация: автоматическая морфологическая аннотация | Английский-словацкий | Этот корпус содержит юридические тексты (Acquis), парламентские дебаты (из корпуса Europarl), статьи из Официального журнала Европейского Союза и тексты из корпуса OPUS. Корпус доступен для загрузки с LINDAT. | Скачать |
Английский-Luganda Parallel Corpus Размер: 150 предложений | Английский-Луганда | Этот корпус содержит библейские отрывки. Корпус доступен для загрузки со специальной веб-страницы. | Скачать |
Англо-непальский параллельный корпус Размер: 1,2 миллиона токенов | английский-непальский | Этот корпус содержит тексты о национальном развитии. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Англо-персидский параллельный корпус Размер: 3,5 миллиона токенов | англо-персидский | Этот корпус содержит литературные, медицинские, политические, пресловутые, религиозные и научные тексты. Корпус доступен для загрузки из каталога ELRA. | Скачать |
UP / TAP с аннотациями OpenNLP Part-of-Speech Tagger (португальский) и OpenNLP Part-of-Speech Tagger (английский) Размер: 31 849 предложений | английский-португальский | Этот параллельный корпус содержит тексты, извлеченные из журнала TAP UP. Корпус доступен для загрузки из репозитория CLARIN: EL. | Скачать |
Корпус соглашения о свободной торговле Размер: 3 миллиона токенов | английский-испанский | Этот корпус содержит тексты о Соглашении о свободной торговле. Корпус доступен через корпускул конкордансера. | Конкордансер |
ECPC Corpus (Европейские сопоставимые и параллельные корпуса архива парламентских выступлений) — набор 1 Размер: 7.6 миллионов токенов | английский-испанский (кастильский) | Этот корпус представляет собой собрание корпусов с метатекстовыми тегами XML, содержащих выступления трех европейских палат (Европейского парламента, британской палаты общин и испанского конгресса Congreso de los Diputados). Это двуязычный двунаправленный письменный корпус. Соответствующую публикацию см. Zanettin (2012). | Скачать |
EnTam: англо-тамильский параллельный корпус (EnTam v2.0) Размер: 169 871 предложение | английский-тамильский | Этот корпус содержит новостные статьи и тексты, связанные с кино. Корпус доступен для загрузки с LINDAT. | Скачать |
Параллельный корпус религиозных религий на английском и урду Размер: 14 371 предложение | Английский-урду | Этот корпус содержит религиозные тексты (Библия и Коран). Корпус доступен для загрузки с LINDAT. | Скачать |
Англо-вьетнамский параллельный корпус Размер: 500000 пар предложений | английский-вьетнамский | Этот корпус содержит газетные и новостные статьи в Интернете, а также тексты из книг и словарей с 2000 по 2007 год. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Эстонско-английский параллельный корпус Размер: 307 000 предложений | эстонский-английский | Этот корпус содержит эстонские законы и их переводы на английский язык и законы ЕС, переведенные на эстонский язык. Корпус доступен для загрузки со специальной веб-страницы. | Скачать |
Финско-английский параллельный корпус fienWaC 1.0 Размер: 2,9 миллиона токенов | Финско-Английский | Этот корпус содержит тексты, сканированные с финского верхнего уровня.fi домены. Корпус доступен для загрузки из репозитория CLARIN.SI. | Скачать |
ParFin Размер: 360 000 токенов | Финско-Русский | Этот корпус содержит литературные тексты с 1990 по 2010 год. Корпус доступен через Конкордансер Корп. | Конкордансер |
Финско-шведский параллельный корпус KOTUS Размер: 4,3 миллиона токенов | Финско-Шведский | Этот корпус содержит корпоративные пресс-релизы, обзоры, отчеты, законы и постановления, а также правительственные предложения с 1993 по 2004 год. Корпус доступен для загрузки из FIN-CLARIN и через Concordancer Korp. | Конкордансер Скачать |
Параллельный корпус информационных бюллетеней IFT FR-GR Лицензия: CC-BY | французско-греческий | Этот корпус содержит информационные бюллетени IFT. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
FREL Размер: 701 401 токен | французско-греческий | Этот корпус содержит художественные тексты. | |
GeFRePaC — Немецкий французский корпус взаимных параллелей Размер: 30 миллионов токенов | Немецко-французский | Этот корпус содержит тексты из базы данных CELEX Европейского Союза. Корпус двунаправленный. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Немецко-греческий корпус QTLP для МЕДИЦИНСКОЙ области Размер: 2,752 пары предложений | Немецко-греческий | Этот корпус содержит медицинские тексты. | Для доступа обратитесь к менеджерам ресурсов. |
Греко-болгарский параллельный корпус Bul-TM Размер: 10 миллионов токенов | Греко-болгарский | Этот корпус содержит социальные и политические тексты. Корпус доступен для загрузки через репозиторий CLARIN: el. | Скачать |
European Parliament Proceedings Parallel Corpus 1996-2011, parallel corpus Греко-английский Размер: 1,2 миллиона предложений | греко-английский | Этот корпус содержит дебаты Европейского парламента с 1996 по 2011 год. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
INTERA Corpus — греко-английская часть Размер: 4 миллиона токенов | греко-английский | Этот корпус содержит тексты из областей права, образования, окружающей среды, туризма и здравоохранения. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
ЧАСТЬ Размер: 3,589,000 пар предложений | исландско-английский | Этот корпус содержит исландские и английские тексты из 11 различных источников. Корпус доступен для загрузки с CLARIN-IS и для поиска через Конкордансер Корп. Соответствующую публикацию см. Barkarson and Steingrímsson (2019) | Конкордансер Скачать |
Норвежско-испанский параллельный корпус Размер: 6 миллионов токенов | Норвежско-испанский | Этот корпус содержит художественные и художественные тексты с 2000 по 2009 год. Корпус доступен через Concordancer Corpuscle и для загрузки в репозитории CLARINO. | Конкордансер Скачать |
Польско-литовский параллельный корпус Лицензия: IS PAS | польско-литовский | Корпус доступен для загрузки из репозитория CLARIN-PL. | Скачать |
СРАВНЕНИЕ: Корпус параллельного перевода с португальского на английский Аннотация: по предложению | португальский-английский | Этот корпус содержит художественные тексты, научные, газетные и туристические статьи. Корпус доступен через специального конкордансера. Соответствующую публикацию см. Frankenberg Garcia and Santos (2003). | Конкордансер |
QTLP Португальско-греческий корпус для МЕДИЦИНСКОЙ области Размер: 62 608 пар предложений | Португальско-греческий | Этот корпус содержит медицинские тексты. | Для доступа обратитесь к менеджерам ресурсов. |
QTLP Португальско-греческий корпус для АВТОМОБИЛЬНОГО домена Размер: 59 297 пар предложений | Португальско-греческий | Этот корпус содержит тексты из автомобильной отрасли. | Для доступа обратитесь к менеджерам ресурсов. |
ParRus Размер: 5,9 миллиона токенов | Русско-Финский | Этот корпус содержит тексты из классической литературы и литературы ХХ века. Корпус доступен через Конкордансер Корп. | Конкордансер |
Сербско-английский параллельный корпус srenWaC 1.0 Размер: 23,1 миллиона токенов | сербско-английский | Этот корпус содержит тексты, сканированные с сербских доменов верхнего уровня .rs. Корпус доступен для загрузки из репозитория CLARIN.SI. | Скачать |
Словенско-английский параллельный корпус slenWaC 1.0 Размер: 718 315 токенов | словенско-английский | Этот корпус содержит тексты, сканированные со словенских доменов верхнего уровня .si. Корпус доступен для загрузки из репозитория CLARIN.SI. | Скачать |
Многоязычный корпус
Корпус | Язык | Описание | Наличие |
---|---|---|---|
Татоеба Размер: 12 миллионов токенов | 117 языков | Этот корпус содержит тексты с веб-сайта Tatoeba. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Параллельный корпус Библии | Прибл. 100 языков | Этот корпус содержит исторические и современные переводы Библии. | |
Параллельный корпус файлов локализации KDE4 (v.2) Размер: 60 миллионов токенов | 92 языка | Этот корпус содержит файлы локализации KDE4. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
OpenSubtitles2011 Размер: 8.31G токенов | 54 языка | Этот корпус содержит субтитры с веб-сайта OpenSubtitles. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Память переводов EAC Размер: 320000 токенов | 50 языков | Этот корпус содержит юридические документы и тексты, связанные с образованием и культурой. Корпус доступен для загрузки через репозиторий CLARIN: el. | Скачать |
Параллельные глобальные голоса Размер: 174 629 документов | Прибл. 50 языков | Этот корпус содержит тексты, сканированные с веб-страницы Global Voices. Корпус доступен для загрузки со специальной веб-страницы. | Скачать |
InterCorp Размер: 1.5 миллиардов токенов | 40 языков | Корпус состоит из двух основных частей: выровненных вручную художественных произведений и ряда сборников: политические комментарии, опубликованные Project Syndicate и VoxEurop, юридические тексты ЕС из корпуса Acquis Communautaire, отчеты Европейского парламента из корпуса Europarl, субтитры фильмов из Откройте базу данных субтитров и Библию. Корпус доступен в основном через ConText concordancer. Для исследовательских целей по запросу могут быть предоставлены индивидуальные лингвистические данные, полученные из корпуса InterCorp. Контактный адрес электронной почты: [email protected]. Соответствующую публикацию см. Čermák and Rosen (2012) | Конкордансер |
DGT-TM-2016 Размер: 373 миллиона токенов | Прибл.30 языков | Этот корпус содержит тексты из европейского законодательства. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Многоязычный параллельный корпус PELCRA Размер: 143 миллиона токенов | 25 языков | Этот корпус содержит тексты с веб-сайтов CORDIC и RAPID, а также пресс-релизы Европейского парламента и Европейской южной обсерватории. Корпус доступен для загрузки из репозитория CLARIN: EL. | Скачать |
DGT-Acquis Аннотация: предложений выровнены | 23 языка | Этот корпус содержит статьи из Официального журнала Европейского Союза с 2004 по 2011 годы. Корпус доступен для загрузки из CLARIN: репозиторий el- | Скачать |
Многоязычный параллельный корпус JRC-Acquis Размер: 1 миллиард токенов | 22 языка | Этот корпус содержит законодательные и юридические тексты Acquis Communautaire за различные периоды, начиная с 1950-х годов. Корпус доступен для загрузки с веб-страницы Европейской комиссии. Соответствующую публикацию см. Steinberger et al. (2014). | Скачать |
Параллельный корпус из Европейской конституции Размер: 3 миллиона токенов | 21 язык | Этот корпус содержит документы Европейской Конституции. Корпус доступен для загрузки через репозиторий CLARIN: el. | Скачать |
Параллельный корпус Europarl Размер: 650 000 токенов | 21 язык | Этот корпус содержит дебаты Европейского парламента с 1996 по 2011 год. Корпус доступен для загрузки с веб-страницы корпуса. | Скачать |
Память переводов ECDC Размер: 320000 токенов | Прибл. 20 языков | Этот корпус содержит тексты из области общественного здравоохранения. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
EMEA Corpus Размер: 31 миллион токенов | Прибл.20 языков | Этот корпус содержит документы Европейского агентства по лекарственным средствам. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
DGT-память переводов Размер: 10,1 миллиона токенов | Прибл. 20 языков | Этот корпус содержит законодательные тексты европейского законодательства. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Параллельный корпус Европейского центрального банка Размер: 757 миллионов токенов | 19 языков | Этот корпус содержит тексты из Европейского центрального банка. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Opus, Helsinki Korp Version Размер: 2,7 миллиарда токенов | 16 языков | Это многоязычный вариант корпуса OPUS, который содержит тексты на следующих языках: чешский, датский, голландский, английский, эстонский, французский, немецкий, греческий, венгерский, итальянский, польский, португальский, русский, шведский, испанский и турецкий. . Корпус доступен через Конкордансер Корп. | Конкордансер |
MULTEXT-East «1984» аннотированный корпус 4.0 Размер: 1,06 миллиона токенов | 11 языков | Этот корпус содержит оригинальный роман Джорджа Оруэлла 1984 года на английском языке и его переводы на следующие языки: болгарский, чешский, эстонский, венгерский, македонский, персидский, польский, румынский, сербский, словацкий и словенский. Корпус доступен для загрузки из репозитория CLARIN.SI. Соответствующую публикацию см. В Erjavec (2012). | Скачать |
ParaCrawl Corpus, версия 1.0 Лицензия: CC Zero | 11 языков | Этот корпус содержит данные веб-сканирования на следующих языках: чешский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, польский, португальский, румынский, русский и испанский. Корпус доступен для загрузки с LINDAT. Кроме того, версию 2.0 корпуса, которая включает шесть новых языков (ирландский, хорватский, мальтийский, литовский, венгерский и эстонский), можно загрузить со специального веб-сайта корпуса. | Скачать |
Многоязычный и параллельный корпус MLCC Размер: 10,2 миллиона токенов | 9 язык | Этот корпус содержит статьи из Официального журнала Европейских сообществ с 1986 по 1994 год на следующих языках: датском, голландском, английском, французском, немецком, греческом, итальянском, португальском и испанском. Корпус доступен для загрузки из каталога ELRA. | Скачать |
SETimes Размер: 43 миллиона токенов | 9 языков | Этот корпус содержит тексты с сайта setimes.com. Корпус доступен для загрузки из репозитория CLARIN: EL. Соответствующую публикацию см. Tyers and Alperen (2010) | Скачать |
Корпус сбалансированных тестов ACCURAT для языков с ограниченными ресурсами Размер: 4608 предложений | 7 языков | Этот корпус содержит тексты на греческом, словенском, румынском, латышском, эстонском, хорватском и литовском языках. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Параллельный корпус CLUVI Размер: 23 миллиона токенов | 6 языков | Этот корпус содержит художественные, юридические, научные, вычислительные, юридические и административные тексты с 2003 по 2012 год в следующих языковых комбинациях: английский-галисийский, галисийский-испанский, французско-галисийский, английский-галисийский-французский-испанский и испанский-каталонский. -Баска. Корпус доступен для загрузки со специальной веб-страницы. | Скачать |
Europarl QTLeap WSD / NED корпус Размер: 52 миллиона токенов | 6 языков | Этот корпус содержит дебаты Европейского парламента в следующих языковых парах: болгарско-английский, чешско-английский, португальский-английский, испанский-английский и баскский-английский. Корпус доступен для загрузки с LINDAT. | Скачать |
MultiJur: многоязычный параллельный корпус юридических текстов Размер: 1,2 миллиона токенов | 5 языков | Этот корпус содержит международные конвенции и договоры на следующих языках: английском, русском, немецком, финском и шведском. Корпус доступен через Конкордансер Корп. | Конкордансер |
ГЛОССОЛОГИЯ Лицензия: CC-BY | 4 языка | Этот корпус содержит статьи из Glossologia, журнала общей и исторической греческой лингвистики, на французском, греческом, английском и немецком языках. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
MULCOLD — Многоязычный корпус юридических документов Размер: 1,2 миллиона токенов | 4 языка | Этот корпус содержит международные конвенции и договоры на русском, английском, шведском и финском языках. Корпус доступен через Конкордансер Корп. | Конкордансер |
SPC — Стокгольмский параллельный корпус Размер: 1,32 миллиона токенов | 4 языка | Этот корпус содержит юридические тексты на английском, африкаанс, китайском и греческом языках. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
Civitas Gentium Размер: 31 артикул | 3 языка | Этот корпус содержит научные статьи и обзоры книг на английском, греческом и французском языках. Корпус доступен для загрузки из репозитория CLARIN: el. | Скачать |
КРАТЕР 2 Корпус Размер: 4 миллиона токенов | 3 языка | Этот корпус содержит тексты из области телекоммуникаций. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Параллельно-параллельные корпуса CsEnVi Размер: 31 миллион токенов | 3 языка | Этот корпус содержит выступления TED и субтитры из корпуса CLUVI на вьетнамском, чешском и английском языках. Корпус доступен для загрузки с LINDAT. | Скачать |
ЦОД — Голландский параллельный корпус Размер: 10,8 миллиона токенов | 3 языка | Этот корпус содержит художественные, публицистические, поучительные и административные тексты на английском, голландском и французском языках. Корпус доступен для загрузки (после регистрации) в Институте голландского языка. Соответствующую публикацию см. Macken et al. (2007). | Скачать |
EuroParl-UdS Аннотация: предложений выровнены | 3 языка | Корпус содержит парламентские дебаты Европейского парламента. Подмножество — это параллельный корпус для следующих языковых комбинаций: английский-немецкий, и английский-испанский. Корпус доступен для загрузки из репозитория CLARIN-D. | Скачать |
Корпус интерпретации Европейского парламента (EPIC) Размер: 177000 токенов | 3 языка | Этот корпус содержит дебаты Европейского парламента на итальянском, английском и испанском языках с переводами во всех возможных комбинациях. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Многоязычный мультимодальный корпус MUSA Размер: 1,2 миллиона слов | 3 языка | Этот параллельный мультимодальный корпус содержит английский, греческий и французский языки. Корпус распространяется CLARIN: EL. | |
PANACEA Англо-французский и англо-греческий параллельный корпус Лицензия: КОНЕЧНЫЙ ПОЛЬЗОВАТЕЛЬ ELRA | 3 языка | Этот корпус содержит экологические и законодательные тексты на английском языке и их французский и греческий переводы. Корпус доступен для загрузки из каталога ELRA. | Скачать |
Польско-болгарско-русский параллельный корпус Размер: 55 текстов | 3 языка | Этот корпус доступен для загрузки из репозитория CLARIN PL. | Скачать |
UMC 0.1: Чешско-русско-английский многоязычный корпус Размер: 1,8 миллиона токенов | 3 языка | Этот корпус содержит новостные статьи и комментарии на чешском, русском и английском языках с веб-сайта Project Syndicate с 1995 по 2008 годы. Корпус доступен для загрузки с LINDAT и через Concordancer Korp. | Конкордансер Скачать |
Другие параллельные корпуса
Двуязычный корпус
Корпус | Язык | Описание | Наличие |
---|---|---|---|
ParCor — Корпус параллельных местоимений-Coreference Аннотация: coreference местоимений | английский-немецкий | Этот корпус содержит выступления TED и публикации книжного магазина ЕС. Корпус доступен для загрузки с веб-страницы OPUS. Соответствующую публикацию см. Guillou et al. (2014). | Скачать |
Параллельный англо-ирландский корпус юридических текстов Аннотация: предложений выровнено | англо-ирландский | Этот корпус содержит юридические тексты. Корпус доступен через специального конкордансера. | Конкордансер |
Англо-румынский корпус NAACL 2003 Размер: 1,6 миллиона токенов | англо-румынский | Корпус содержит тексты 2003 года. | Для доступа обратитесь к менеджерам ресурсов. |
Англо-шведский параллельный корпус Размер: 3.5 миллионов токенов | английский-шведский | Этот корпус содержит художественные и художественные тексты. Он двунаправленный. | Для доступа обратитесь к менеджерам ресурсов. |
Estonian Open Parallel Corpus 2012. Эстонско-английский Размер: 2,5 миллиона токенов | эстонский-английский | Этот корпус содержит библейские и юридические тексты. Корпус доступен для загрузки с сайта META-SHARE. | Скачать |
SzegedParalell: angol-magyar párhuzamos korpusz | англо-венгерский | Этот корпус содержит литературные тексты и тексты о Европейском Союзе. Корпус доступен для загрузки со специальной веб-страницы. Соответствующую публикацию см. Tóth et al. (2002) | Скачать |
Корпус ТРИС Размер: 1.76 миллионов токенов | Немецко-испанский | Этот корпус содержит тексты Европейской комиссии с 1997 по 2010 год. Корпус доступен для загрузки со специальной веб-страницы. Соответствующую публикацию см. В Parra Escartín (2012). | Скачать |
ЛИЛА параллельный корпус Размер: 8 миллионов токенов | Литовско-латышский | Этот корпус содержит художественные и художественные тексты с 1991 по 2012 год.Он двунаправленный. Корпус доступен через специального конкордансера. Соответствующую публикацию см. Utka et al. (2012). | Конкордансер |
Выравнивание вручную CES Польско-английский параллельный корпус Размер: 1,4 миллиона токенов | польско-английский | Этот корпус содержит отчеты CES. Корпус доступен для загрузки со специальной веб-страницы. | Скачать |
Словацко-английский параллельный корпус Размер: 556 миллионов токенов | Словацко-английский | Этот корпус содержит тексты из языковых книг. Он двунаправленный. Корпус доступен через специального конкордансера. | Конкордансер |
Многоязычный корпус
Корпус | Язык | Описание | Наличие |
---|---|---|---|
Корпус OPUS Размер: Множество подразделений | Прибл. 100 языков | Этот корпус содержит различные подкорпорации, которые объединяют тексты из большого количества областей, таких как литературные тексты, политические документы, субтитры, документы ООН и дебаты Европейского парламента. Корпус доступен для загрузки со специальной веб-страницы и через специализированного конкордансера. Соответствующую публикацию см. Tiedemann (2009) | Конкордансер Скачать |
Болгарский язык X Параллельный корпус2 Размер: 1,2 миллиарда токенов | 50 языков | Этот корпус является частью Болгарского национального корпуса. Корпус доступен через специального конкордансера. | Конкордансер |
Магазин книг ЕС Размер: 3,5 миллиарда токенов | 48 языков | Этот корпус содержит тексты из сборников законов ЕС и связанных с ними публикаций. Корпус доступен для загрузки с веб-страницы OPUS. Соответствующую публикацию см. В Skadiš et al.(2014) | Скачать |
Многоязычный параллельный корпус PELCRA Размер: 143 миллиона токенов | 25 языков | Этот корпус содержит тексты с веб-сайтов CORDIC и RAPID, а также пресс-релизы Европейского парламента и Европейской южной обсерватории. Корпус доступен для загрузки по адресу. | Скачать |
TED-Parallel-Corpus Размер: 300 000 предложений | 11 языков | Этот корпус содержит выступления TED на английском языке и переводы на следующие языки: арабский, упрощенный китайский, традиционный китайский, голландский, французский, немецкий, иврит, итальянский, японский, корейский и русский языки. Корпус доступен для загрузки с GIT-HUB. | Скачать |
SETimes Размер: 43 миллиона токенов | 10 языков | Этот корпус содержит тексты из времен.com веб-сайт. Корпус доступен для загрузки со специальной веб-страницы. Соответствующую публикацию см. В Tyers and Alperen (2010). | Скачать |
Параллельный корпус Организации Объединенных Наций Размер: 335 миллионов токенов | 6 языков | Этот корпус содержит официальные отчеты и другие парламентские документы Организации Объединенных Наций, находящиеся в общественном достоянии, на следующих языках: английском, русском, испанском, французском, китайском и арабском. Корпус доступен для загрузки со специальной веб-страницы. Соответствующую публикацию см. Ziemski et al. (2016). | Скачать |
микротопия Размер: 1,5 миллиона токенов | 6 языков | Этот корпус содержит твиты и сообщения в блогах на следующих языковых парах: английский-китайский, английский-арабский, английский-русский, английский-корейский и английский-японский. Корпус доступен для загрузки со специальной веб-страницы. | Скачать |
Корпус QTLeap V1.2 Размер: 140000 токенов | 5 языков | Этот корпус содержит тексты, относящиеся к устранению неполадок компьютеров и ИТ для следующих языковых пар: болгарско-английский, чешский-английский, португальский-английский, испанский-английский и баскский-английский Корпус доступен для загрузки с META-SHARE по лицензии CC-BY. | Скачать |
Параллельная вики Лицензия: CC-BY | 4 языка | Этот корпус содержит тексты Википедии в следующих языковых парах: английский-немецкий, английский-румынский и английский-испанский. | Для доступа обратитесь к менеджерам ресурсов. |
Корпус новостей QTLeap Размер: 1104 предложения | 4 языка | Этот корпус содержит новостные статьи в следующих языковых парах: английский-чешский, английский-немецкий и английский-испанский. | Для доступа обратитесь к менеджерам ресурсов. |
Scielo corpus | 4 языка | Этот корпус содержит научные статьи из базы данных Scielo в следующих языковых парах: английский-французский, английский-испанский и английский-португальский. | Для доступа обратитесь к менеджерам ресурсов. |
MultiUN: многоязычный параллельный текст ООН 2000–2009 Размер: 1 миллиард токенов | 3 языка | Этот корпус содержит тексты с веб-сайта Организации Объединенных Наций с 2000 по 2009 год на следующих языковых парах: испанский-китайский, китайский-испанский, французский-китайский и китайский-французский. Корпус доступен для загрузки со специальной веб-страницы. Соответствующую публикацию см. Eisele and Chen (2010). | Скачать |
REVEAL-THIS Corpus Размер: 325 000 слов | 3 языка | Это многоязычный корпус английского, французского и греческого языков. | Для доступа обратитесь к менеджерам ресурсов. |
REVISTA PESQUISA FAPESP PARALLEL CORPORA Размер: 150 000 предложений | 3 языка | Этот корпус содержит тексты из бразильского журнала REVISTA PESQUISA FAPESP в следующих языковых парах: португальский-английский и португальский-испанский. Корпус доступен для загрузки с веб-страницы корпуса. | Скачать |
Публикации на параллельных корпусах
[Баркарсон и Штайнгримссон, 2019] Старкадур Баркарсон и Стейндор Штайнгримссон.2019. Компиляция и фильтрация ParIce: англо-исландский параллельный корпус.
[Bojar et al. 2016] Ондржей Бояр, Ондржей Душек, Том Кочми, Йиндржих Либовицки, Михал Новак, Мартин Попель, Роман Судариков, Душан Вариш. 2016. CzEng 1.6: Расширенный чешско-английский параллельный корпус с пристыкованными инструментами обработки.
[Чермак и Розен 2012] Франтишек Чермак и Александр Розен. 2012. Случай с InterCorp, многоязычным параллельным корпусом. Международный журнал Corpus. Языкознание , 17 (3): 411–427.
[Eisele and Chen 2010] Андреас Эйзеле, Ю Чен. 2010. MultiUN: многоязычный корпус документов Организации Объединенных Наций.
[Erjavec 2012] Tomaž Erjavec. 2012. MULTEXT-East: морфосинтаксические ресурсы для языков Центральной и Восточной Европы.
[Франкенберг Гарсия и Сантос 2003] Ана Франкенберг-Гарсия и Диана Сантос. 2003. Представляем COMPARA, португальско-английский параллельный корпус.
[Guillou et al. 2014] Лиана Гийу, Кристиан Хардмайер, Аарон Смит, Йорг Тидеманн, Бонни Уэббер.2014. ParCor 1.0: Корпус параллельного сравнения местоимений для статистической поддержки.
[Macken et al. 2007] Лив Маккен, Юлия Трушкина, Ханс Паулюссен, Лидия Рура, Пит Десмет, Вилли Вандевеге. 2007. Голландский параллельный корпус: многоязычный аннотированный корпус.
[Парра Эскартин 2012] Карла Парра Эскартин. 2012. Разработка и составление специализированного испано-немецкого параллельного корпуса.
[Skadiš et al. 2014] Райвис Скадиньш, Йорг Тидеманн, Робертс Розис, Дайга Дексне.2014. Миллиарды параллельных слов бесплатно: создание и использование корпуса книжных магазинов ЕС.
[Steinberger et al. 2014] Ральф Штайнбергер, Мохамед Эбрагим, Александрос Пулис, Мануэль Карраско-Бенитес, Патрик Шлютер, Марек Пшбышевски, Сигне Гилбро. 2014. Обзор многоязычных параллельных корпусов Европейского Союза.
[Тидеманн 2009] Йорг Тидеманн. 2009. Новости OPUS — Коллекция многоязычных параллельных корпусов с инструментами и интерфейсами.
[Tóth et al.2002] Кристина Тот, Ричард Фаркас, Андраш Кочор. 2002. Выравнивание предложений венгерско-английских параллельных корпусов с использованием гибридного алгоритма.
[Тайерс и Альперен, 2010] Фрэнсис М. Тайерс и Мурат Сердар Альперен. 2010. South-Eastern European Times: Параллельный корпус балканских языков.
[Utka et al. 2012] Андрюс Утка, Кристина Леване-Петрова, Агне Белинскиене, Иоланта Ковалевскайте, Эрика Римкуте, Дайра Вевере. 2012. Литовско-латышско-литовский параллельный корпус.
[Ziemski et al.2016] Михал Зиемский, Марцин Юнчис-Даумунт, Бруно Пуликен. 2016. Параллельный корпус Организации Объединенных Наций v1.0.
Эксперимент по приручению чернобурки | Эволюция: образование и пропаганда
Исследование по одомашниванию чернобурки часто называют одним из самых важных долгосрочных исследований, когда-либо проводившихся в биологии. Однако в 1959 году, в том же году, когда оно началось, работа была на мгновение закрыта премьер-министром Советского Союза. Проблема для Беляева и Трута заключалась в том, что их эксперимент по одомашниванию, как и любой эксперимент по одомашниванию, был экспериментом в области генетики.Но работа в области менделевской генетики в то время в Советском Союзе была по сути незаконной из-за псевдонаучного шарлатана по имени Трофим Лысенко (Joravsky 1979; Soyfer 1994).
В середине 1920-х годов руководство Коммунистической партии, пытаясь прославить рядового гражданина, начало продвигать необразованных людей из пролетариата в научное сообщество. Лысенко был одним из таких людей. Сын крестьянского крестьянства с Украины, Лысенко не учился читать, пока не был подростком, и его образование, как это было, приравнивалось к заочной степени в садоводческой школе.Не имея никакого образования, он все же получил работу среднего звена в Гянджинской селекционной лаборатории в Азербайджане в 1925 году. Лысенко убедил репортера Правды , писавшего рассказ о славных ученых-крестьянских ученых режима, что урожай его гороха он, по его мнению, был намного выше среднего, и что его техника могла спасти голодающий СССР. В статье « Правда » репортер восторженно написал, что «у босоногого профессора Лысенко есть последователи… и светила агрономии приезжают… и с благодарностью пожимают ему руку.Чистая выдумка, но история привела Лысенко к всеобщему вниманию, а Иосиф Сталин гордился тем, что он читал.
Со временем Лысенко заявил бы, что проводил эксперименты по созданию зерновых культур, в том числе пшеницы и ячменя, которые давали высокие урожаи в холодные периоды года, если бы их семена перед посадкой долго хранились в ледяной воде. Более того, Лысенко утверждал, что потомство этих растений также будет давать более высокие урожаи из поколения в поколение.По его словам, этот метод может быстро удвоить урожайность сельскохозяйственных угодий в Советском Союзе всего за несколько лет. По правде говоря, Лысенко никогда не проводил законных экспериментов по увеличению урожайности. Любые «данные», которые он утверждал, он просто сфабриковал.
Вскоре Сталин стал его союзником, и Лысенко начал крестовый поход по дискредитации работ по менделевской генетике, потому что доказательство генетической теории эволюции, вероятно, разоблачит его как мошенника. Он назвал генетиков за границей и в Советском Союзе подрывниками.Его звезда восходила, и на конференции, состоявшейся в Кремле в 1935 году, после того, как Лысенко закончил речь, в которой заклеймил западных генетиков как «саботажников», Сталин поднялся и закричал: «Браво, товарищ Лысенко, браво».
Лысенко был назначен ответственным за всю политику в отношении биологических наук в июле 1948 года. В следующем месяце на заседании Всесоюзной академии сельскохозяйственных наук им. Ленина он выступил с докладом, который сегодня считается самым лицемерным и опасным. выступление в истории советской науки.В своем выступлении «Положение в биологической науке» Лысенко проклял «современную реакционную генетику», имея в виду менделевскую генетику. В конце его разглагольствования публика бурно ликовала. Присутствовавших генетиков заставили встать и опровергнуть свои научные знания и практику. Если они отказывались, их исключали из Коммунистической партии. После этой ужасной речи тысячи генетиков были уволены с работы. Десятки, может быть, сотни были заключены в тюрьму, а некоторые были убиты приспешниками Лысенко.
Беляев не мог сидеть сложа руки. Прочитав выступление Лысенко в газете, он пришел в ярость. Его жена Светлана хорошо это помнит: «Дмитрий шел ко мне с суровыми печальными глазами, беспокойно наклоняя и сгибая газету в руках». Другой коллега вспоминает, как столкнулся с ним в тот день и как Беляев разозлился, что Лысенко — «научный бандит» (Дугаткин, Трут, 2017). Игнорируя личный риск, Беляев начал говорить об опасности лысенковщины всем ученым, будь то друзья или враги.
Дело Николая Вавилова, одного из интеллектуальных кумиров Беляева, показывает, насколько опасно было выступать против Лысенко (Медведев 1969; Прингл 2008; Сойфер 1994). Вавилов изучал одомашнивание растений, а также был одним из ведущих ботаников мира, путешествуя по шестидесяти четырем странам за семенами. Только за свою жизнь три ужасных голода в России убили миллионы людей, и Вавилов посвятил свою жизнь поиску способов выращивания сельскохозяйственных культур для своей страны.Его исследовательская программа была сосредоточена на поиске сортов сельскохозяйственных культур, которые были менее восприимчивы к болезням.
Коллекционные поездки Вавилова стали легендой. В одной из трех экспедиций он был арестован на ирано-российской границе и обвинен в шпионаже просто потому, что у него было несколько немецких книг по ботанике. Во время другой поездки, на этот раз к границе с Афганистаном, он упал, когда шагал между двумя вагонами, и его оставили болтаться за локти, когда поезд рванулся вперед. Во время очередной поездки в Сирию он заразился малярией и сыпным тифом .
Вавилов собрал больше живых образцов растений, чем любой мужчина или женщина в истории, и он создал сотни полевых станций, чтобы другие могли продолжить его работу.
На самом деле Вавилов подружился с молодым Лысенко в 1920-х годах, еще до того, как стало ясно, что Лысенко был злым шарлатаном. Со временем Вавилов стал с подозрением относиться к результатам Лысенко, и в серии экспериментов, пытающихся повторить то, что, по словам Лысенко, он открыл, Вавилов доказал себе и другим, которые были готовы слушать (хотя и не многие), что Лысенко был мошенником. .Затем он стал самым бесстрашным противником Лысенко. В отместку Сталин запретил Вавилову больше выезжать за границу, и он был осужден в правительственной газете Правда . Лысенко предупредил Вавилова, что «когда такие ошибочные данные будут сметены,… и те, кто не понял последствий», также будут «сметены». Вавилов не испугался, и на заседании Всесоюзного института селекции растений заявил: «Мы пойдем в костер, сожжем, но мы не отступим от своих убеждений.
В 1940 году Вавилов был похищен четырьмя мужчинами в темных костюмах и брошен в страшную Лубянскую тюрьму КГБ в Москве. Затем его отправили в еще более отдаленную тюрьму. Там в течение 3 лет человек, который собрал 250 000 образцов одомашненных растений, чтобы решить загадку голода на своей родине, медленно умер от голода.
У власти Лысенко были приливы и отливы. В 1959 году, когда эксперимент по приручению лисиц только начинался, Лысенко разочаровывало, что его влияние на советскую биологию ослабло.Что-то нужно было сделать. И Институт цитологии и генетики, где только начинался эксперимент по одомашниванию лисиц, где Беляев был заместителем директора и где им хватило наглости вписать «генетика» в название института, казался хорошим местом для атаки.
Институт цитологии и генетики был частью нового гигантского научного города Академгородок. Задолго до того, как этот город был построен, русский писатель Максим Горький написал о вымышленном «городке науки … серии храмов, в которых каждый ученый является священником … где ученые каждый день бесстрашно исследуют загадочные загадки, окружающие нашу планету.Здесь Горький видел «… литейные производства и мастерские, где люди выковывают точные знания, гранят весь опыт мира, превращая его в гипотезы, в инструменты для дальнейшего поиска истины». Академгородок был тем, что имел в виду Горький. Здесь жили тысячи ученых из Института цитологии и генетики, Института математики, Института ядерной физики, Института гидродинамики и полдюжины других институтов.
В январе 1959 года в Академгородок была направлена созданная Лысенко комиссия из Москвы.Этому комитету было поручено определить, какая именно работа ведется в Институте цитологии и генетики, и Беляев, Трут и их коллеги понимали серьезность ситуации. «Члены комитета, как сказал Трут,« шпионили в лабораториях », и ходили слухи, что комитет недоволен. Когда комитет встретился с Михаилом Лаврентьевым, руководителем всех институтов Академгородка, они сказали ему, что «направление Института цитологии и генетики методологически неверно» (Дугаткин, Трут, 2017).Зловещие слова из группы лысенковцев.
Премьер-министр СССР Никита Хрущев узнал об отчете комиссии об Академгородке. Хрущев был сторонником Лысенко, и он решил сам посмотреть, что происходит. В сентябре 1959 г., возвращаясь из поездки к Мао Цзэ-Дуну в Китае, он остановился в Новосибирске и отправился в Академгордок.
Сотрудники всех научных институтов Академгородка собрались для этого визита, и Трут вспоминает, что премьер «очень быстро прошел мимо собравшихся, не обращая на них никакого внимания», когда приступил к встрече с руководителями.«Хрущев, — вспоминает Трут, — был очень недоволен намерением причинить всем неприятности из-за генетиков». То, что сказали в тот день администраторы Хрущева и Академгородка, не было записано, но отчеты того времени ясно показывают, что премьер-министр намеревался закрыть в тот день Институт цитологии и генетики, а вместе с ним и зарождающийся эксперимент по приручению чернобурки.
К счастью для науки, дочь Хрущева Рада была с ним в Академгородке. Рада, уважаемый журналист, по образованию биолог, прекрасно понимала, что Лысенко — мошенник.Ей как-то удалось убедить отца оставить Институт цитологии и генетики открытым. По иронии судьбы, поскольку Хрущев чувствовал, что должен сделать что-то , чтобы выразить свое недовольство, на следующий день после своего визита он уволил руководителя Института цитологии и генетики. Институтом руководил заместитель директора Беляев.
Если бы Рада Хрущев в тот день не выступил за науку, исследование по одомашниванию лисиц, вероятно, закончилось бы еще до того, как оно началось.Но он выжил и процветал и продолжает проливать новый свет на процесс приручения.
векторов слов для 157 языков · fastText
Мы распространяем предварительно обученные векторы слов для 157 языков, обученные на Common Crawl и Wikipedia с использованием fastText. Эти модели были обучены с использованием CBOW с позиционными весами в размерности 300, с символьными n-граммами длиной 5, окном размера 5 и 10 негативами. Мы также распространяем три новых набора данных аналогий для французского, хинди и польского языков.
Скачать напрямую из командной строки или из python
Для загрузки с помощью командной строки или кода python вы должны установить пакет python, как описано здесь.
$ ./download_model.py en
Скачивание https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.en.300.bin.gz
(19,78%) [======== =>]
После завершения загрузки используйте модель как обычно:
$./ fasttext nn cc.en.300.bin 10
Слово запроса?
>>> import fasttext.util
>>> fasttext.util.download_model ('en', if_exists = 'ignore')
>>> ft = fasttext.load_model ('cc.en.300.bin')
Согласовать размер
Предварительно обученные векторы слов, которые мы распределяем, имеют размерность 300. Если вам нужен меньший размер, вы можете использовать наш редуктор размерности. Чтобы использовать эту функцию, вы должны установить пакет python, как описано здесь.
Например, чтобы получить векторы размерности 100:
$ ./reduce_model.py cc.en.300.bin 100
Загрузка модели
Уменьшение размеров матрицы
Сохранение модели
cc.en.100.bin сохранено
Затем вы можете использовать файл модели cc.en.100.bin
как обычно.
>>> import fasttext
>>> import fasttext.util
>>> ft = fasttext.load_model ('cc.en.300.bin')
>>> ft.get_dimension ()
300
>>> быстрый текст.util.reduce_model (футы, 100)
>>> ft.get_dimension ()
100
Затем вы можете использовать объект модели ft
как обычно:
>>> ft.get_word_vector ('hello'). Shape
(100,)
>>> ft.get_nearest_neighbors ('hello')
[(0.775576114654541, u'heyyyy '), (0.76862
9, u'hellow' ), (0.7663413286209106, u'hello- '), (0.7579624056816101, u'heyyyyy'), (0.7495524287223816, u'hullo '), (0.7473770380020142, u'.hello'), (0.74072
609253, u'Hiiiii '), (0.74026167371, u'hellooo), (0.7399682402610779, u'hello.), (0.7396857738494873, u'Heyyyyy')]
или сохраните для дальнейшего использования:
>>> ft.save_model ('cc.en.100.bin')
Формат
Векторы слов доступны как в двоичном, так и в текстовом форматах.
Используя бинарные модели, векторы для слов вне словарного запаса могут быть получены с помощью
$ ./fasttext print-word-vectors wiki.it.300.bin
, где файл oov_words.txt содержит слова вне словарного запаса.
В текстовом формате каждая строка содержит слово, за которым следует его вектор. Каждое значение разделено пробелом, а слова сортируются по частоте в порядке убывания. Эти текстовые модели можно легко загрузить в Python, используя следующий код:
импорт io
def load_vectors (имя_файлы):
fin = io.open (fname, 'r', encoding = 'utf-8', newline = '\ n', errors = 'ignore')
n, d = map (int, fin.readline (). split ())
data = {}
для линии в плавнике:
токены = line.rstrip (). split ('')
данные [токены [0]] = карта (с плавающей точкой, токены [1:])
вернуть данные
Токенизация
Мы использовали Stanford word segmenter для китайского, Mecab для японского и UETsegmenter для вьетнамского. Для языков, использующих латинский, кириллический, иврит или греческий алфавит, мы использовали токенизатор из инструментов предварительной обработки Europarl . Для остальных языков мы использовали токенизатор ICU.
Более подробную информацию об обучении этих моделей можно найти в статье Изучение векторов слов для 157 языков .
Лицензия
Словесные векторы распространяются по лицензии Creative Commons Attribution-Share-Alike License 3.0 .
Список литературы
Если вы используете эти слова-векторы, процитируйте, пожалуйста, следующую статью:
E. Grave *, P. Bojanowski *, P. Gupta, A. Joulin, T. Mikolov, Изучение векторных слов для 157 языков
@inproceedings {grave2018learning,
title = {Изучение векторных слов для 157 языков},
author = {Граве, Эдуард и Бояновски, Петр и Гупта, Прахар и Жулен, Арман и Миколов, Томас},
booktitle = {Труды Международной конференции по языковым ресурсам и оценке (LREC 2018)},
год = {2018}
}
Наборы оценочных данных
Наборы данных для оценки аналогий, описанные в документе, доступны здесь: французский, хинди, польский.
Модели
Модели можно скачать по адресу:
Африкаанс: bin, текст | Албанский: bin, текст | Alemannic: bin, текст |
Амхарский: bin, текст | Арабский: bin, текст | Арагонский: bin, текст |
Армянский: bin, текст | Ассамский: bin, текст | Астурийский: bin, текст |
Азербайджанский: bin, текст | Башкирский: bin, текст | Баскский: bin, текст |
Баварский: bin, текст | Белорусский: bin, текст | Бенгальский: bin, текст |
Бихари: bin, текст | Бишнуприя Манипури: bin, текст | Боснийский: bin, текст |
Бретонский: bin, текст | Болгарский: bin, текст | Бирманский: bin, текст |
Каталонский: bin, текст | Cebuano: bin, текст | Central Bicolano: bin, text | 90 089
Чеченский: bin, текст | Китайский: bin, текст | Чувашский: bin, текст |
Корсиканский: bin, текст | Хорватский: bin, текст | Чешский: bin, текст |
датский : bin, text | Divehi: bin, text | Dutch: bin, text |
Eastern Punjabi: bin, text | Египетский арабский: bin, текст | Emilian-Romagnol: bin, text |
English : bin, text | Erzya: bin, text | Esperanto: bin, text |
Estonian: bin, text | Fiji Hindi: bin, text | Finnish: bin, text |
French: bin, текст | Галисийский: bin, текст | Грузинский: bin, текст |
Немецкий: bin, текст | Гоан Конкани: bin, текст | Греческий: bin, текст |
Гуджарати: bin, текст | Гаитянский: bin, te xt | Иврит: bin, текст |
Hill Mari: bin, text | Хинди: bin, текст | Венгерский: bin, текст |
Исландский: bin, текст | Ido: bin, text | Илокано: bin, текст |
Индонезийский: bin, текст | Интерлингва: bin, текст | Ирландский: bin, текст |
Итальянский: bin, текст | Японский: bin, текст | Яванский: bin, текст |
Каннада: бин, текст | Капампанган: бин, текст | Казахский: бин, текст |
Кхмерский: бин, текст | Киргизский: бин, текст | Корейский: бин, текст |
Курдский (курманджи): бин, текст | Курдский (сорани): бин, текст | Латинский: бин, текст |
латышский: бин, текст | лимбургский: бин, текст | Литовский: бин, текст |
Лом bard: bin, текст | Нижний саксонский: bin, текст | Люксембургский: bin, текст |
Македонский: bin, текст | Maithili: bin, текст | Малагасийский: bin, текст |
Малайский: bin , текст | Малаялам: корзина, текст | Мальтийский: корзина, текст |
Манкс: корзина, текст | Маратхи: корзина, текст | Мазандарани: корзина, текст |
Луг Мари: корзина, текст | Minangkabau: bin, text | Mingrelian: bin, text |
Mirandese: bin, text | Mongolian: bin, text | Nahuatl: bin, text |
Neapolitan: bin, text | Nepali: bin , текст | Newar: bin, text |
North Frisian: bin, text | Northern Sotho: bin, text | Norwegian (Bokmål): bin, text |
Norwegian (Nynorsk): bin, text | O ccitan: bin, text | Oriya: bin, text |
Ossetian: bin, text | Palatinate German: bin, text | Pashto: bin, text |
Persian: bin, text | Piedmontese: bin , текст | Польский: bin, текст |
Португальский: bin, текст | Quechua: bin, текст | Румынский: bin, текст |
Романский: bin, текст | Русский: bin, текст | Саха: бин, текст |
Санскрит: бин, текст | Сардинский: бин, текст | Шотландский: бин, текст |
Шотландский гэльский: бин, текст | Сербский: бин, текст | сербо-хорватский : bin, текст |
Сицилийский: bin, текст | Синдхи: bin, текст | Сингальский: bin, текст |
Словацкий: bin, текст | Словенский: bin, текст | Сомали: bin, текст |
Южно-азербайджанский: bin, текст | Испанский: bin, текст | Суданский: bin, текст |
Суахили: bin, текст | Шведский: bin, текст | Тагальский: bin, текст |
Таджикский : bin, текст | Тамильский: bin, текст | Татарский: bin, текст |
Телугу: bin, текст | Тайский: bin, текст | Тибетский: bin, текст |
Турецкий: bin, текст | Туркменский: bin, текст | Украинский: bin, текст |
Верхний сербский: bin, текст | Урду: bin, текст | Уйгурский: bin, текст |
Узбекский: bin, текст | Венецианский : bin, текст | вьетнамский: bin, текст |
Volapük: bin, text | Walloon: bin, text | Waray: bin, text |
Welsh: bin, text | West Flemish: bin, текст | Запад Фризский: bin, текст |
Western Punjabi: bin, text | Идиш: bin, текст | Yoruba: bin, text |
Zazaki: bin, text | Zeelandic: bin, text |
Русский язык
Главный редактор : Виктор М.Шаклеин, доктор филологических наук, профессор.
ISSN: 2618-8163 (Печатный) ISSN: 2618-8171 (Онлайн)
Год основания 2003. Периодичность публикации : ежеквартально.
ИЗДАТЕЛЬ: Российский университет дружбы народов (РУДН)
Indexation : Российский индекс научного цитирования, Scopus, Google Scholar, Ulrich's Periodicals Directory, WorldCat, East View, Cyberleninka, Dimensions, DOAJ, ResearchBib, Lens, Microsoft Academic, Research5Life, EBSCOhost, JournalTOCs, Британская библиотека, Бодлианские библиотеки ( Оксфордский университет), Библиотека Гентского университета
Открытый доступ: Открытый доступ.
APC: Без платы за обработку статьи.
Рецензия: двойной слепой.
Официальное зарегистрированное название на английском языке: Russian Language Studies
См. Историю журнала, чтобы получить информацию о предыдущих названиях журнала.
Журнал «Русский языкознание» специализируется на актуальных проблемах русского языка и методике обучения русскому языку как иностранному, неродному и родному в условиях русской, тесно связанной и не связанной языковой среды.
Журнал представляет собой платформу для российских и зарубежных ученых, отражает не только лингвистические, но и культурно-исторические, социальные аспекты изучения и преподавания русского языка.
Миссия журнала - дать возможность специалистам-русистам из разных стран и регионов объективно информировать международное научное сообщество о современных исследованиях русского языка, его функционировании в многополярном мире и привлечь внимание ученых к ним. эти проблемы.
Целью журнала является создание научного, исследовательского, образовательного и информационного пространства для представления достижений российских и зарубежных ученых в области изучения русского языка и методики преподавания русского языка как иностранного.
Целями журнала являются:
- Публикация достижений российских и зарубежных ученых в области изучения русского языка, публикация результатов научных центров по развитию и сохранению русского языка в многополярном мире;
- Характеристика теоретических работ по функционированию русского языка в России и за рубежом;
- Указание на проблемы в методике обучения русскому языку как иностранному, неродному и родному;
- Анализ современных тенденций преподавания русского языка в школе и университете;
- Отражение проблем изучения и преподавания русского языка как иностранного и сохранения русского языка в диаспорах;
- Проблемы развития русского языка как языка науки;
- Представление российской национальной политики на русском языке и методики его преподавания;
- Демонстрация медиа-дидактических и электронных средств обучения русскому языку.
Следующие выпуски журнала запланированы как тематические и посвящены наиболее актуальным проблемам изучения русского языка.