Дарья Оверникова
В рубрике «Паспорт республиканца» участники рассказывают о себе — о своём пути в науку, успехах и провалах и о том, зачем им всё это нужно.
Об образовательной программе
Когда я поступала в Вышку, я думала, что буду учиться на программе «Компьютерная лингвистика». Я загорелась этой идеей в десятом классе, но мне не хватило баллов по профильной математике, чтобы подать документы. Поэтому я пришла на программу, которая мне тоже нравилась – «Иностранные языки и межкультурная коммуникация».
Вместо того, чтобы злиться, что я не поступила на программу, которую выбрала изначально, я решила попробовать заниматься тем, что мне интересно, даже учась на другой программе.
На программе «Иностранные языки и межкультурная коммуникация» мы занимаемся практическими аспектами иностранного языка. В конце второго курса нам нужно выбрать один из трех треков: перевод, преподавание или межкультурная коммуникация. Я, скорее всего, выберу преподавание.
О работе в Научно-учебной лаборатории учебных корпусов
Это лаборатория по компьютерной лингвистике и корпусной лингвистике. Корпус — это большое собрание текстов, обработанных так, чтобы можно было работать с большим объемом данных. В корпусе есть информация о частях речи, часто — о структуре предложений. Это отличает его от простого собрания текстов.
Мы поддерживаем один из корпусов, которые давно существуют в Вышке, он называется REALEC и содержит академические эссе, которые написаны для независимого экзамена в формате IELTS. Мы аннотируем их на предмет ошибок. REALEC отличается от Национального корпуса русского языка, который создан с целью собрать как можно больше текстов русского языка разных жанров, чтобы можно было делать выводы о русском языке в целом. Нас же интересуют ошибки, которые статистически допускают носители русского языка, когда пишут на английском. Я размечаю корпус, нахожу новые тексты и отмечаю в них ошибки.
Кроме того, мы пытаемся разработать приложение Adviser, которое будет помогать студентам писать эссе на английском языке. Мои коллеги пишут маленькие программы, которые находят ошибки в эссе. Эти программы выдают предложения, в которых, по их мнению, содержится ошибка. Моя задача — определить, правы ли программы или их надо доработать.
О выявлении ошибок в эссе
Выявлять наиболее частые ошибки, например, постановку артиклей, становится довольно скучно. Есть более сложные задачи: объяснить людям посредством программы, в каком случае нельзя использовать какое-то время. Мы довольно долго мучаемся с тем, как определять ошибки в согласованиях, когда человек пишет подлежащее в одном числе, а сказуемое в другом, например, «we has». На первый взгляд, это кажется простым, но мы сидим с этим уже месяц, потому что в длинных предложениях появляется больше сложных случаев, и такие мелкие ошибки влияют на работу программы.
Знание структуры языка всегда помогает в том, что мы делаем. Можно работать без особого знания английского, если ты научишься разбираться в системе наших тэгов, которые нужно повесить на конкретную ошибку, видеть паттерны ошибок и искать примеры. Нам даются эссе, в которых не видно оценок, только проценты, и не размечены ошибки. Наша задача — найти их.
Авторы эссе могут быть супер-непредсказуемыми. У меня даже есть закрытая группа, где я рассказываю про ошибки авторов. Она закрытая, потому что я не уверена, что Вышка обрадуется, если я буду открыто обсуждать ошибки из эссе студентов, которые они посылают на независимый экзамен.
Как объяснить бабушке, чем ты занимаешься?
У меня были попытки объяснить бабушке, семье и друзьям родителей, что я делаю. Мне помогает факт, что моя лаборатория разрабатывает приложение: тогда у людей что-то щёлкает. Я говорю, что мы изучаем, какие ошибки делают студенты, и пытаемся сделать так, чтобы они их не делали.
Практическое применение – это то, с чем люди могут себя соотнести. Мы все изучаем английский язык и делаем в нем ошибки.
Почему наука, а не что-то еще?
Мне нравится академия как сообщество и ощущения, что мы делаем что-то интересное, пытаемся понять, как устроен мир. Среди моих коллег достаточно ребят, которые занимаются наукой или, по крайней мере, проявляют к этому интерес.
О планах
Пока что я вижу своё будущее так: я пойду в магистратуру, скорее всего, в Вышке, и постараюсь построить академическую карьеру. Я выбираю между двумя магистерскими программами: «Компьютерная лингвистика» и «Цифровые методы в гуманитарных науках». На последней изучают взаимодействие гуманитарных и компьютерных наук и учатся делать более практические проекты в духе «Прожито» или «Tolstoy Digital».
Ещё мне хочется преподавать. Если я собираюсь жить как гуманитарий, то мне, скорее всего, придётся заниматься несколькими вещами одновременно — наукой и преподавательством. Возможно, я перегорю и мне захочется делать что-то другое. Я считаю, что это менять поле деятельности вполне нормально.
Я была бы не против стать уважаемым профессором, у которого хотят писать курсач и которого любят студенты. Это уже, по-моему, хорошее начало