Мария Улиханова

Текст

Карен Спарк хотела, чтобы компьютер понимал человеческий язык, а не код. Именно ее технология лежит в основе таких поисковых систем как Google

После окончания колледжа Карен по приглашению Маргарет Мастерман поступила на работу в языковой исследовательский отдел Кембриджского университета. В 1958 Спарк опубликовала статью «Аналогия между машинным переводом и поиском в библиотеке», написанную в соавторстве с Мастерман и Нидхемом. Спустя десять лет ее перевели в компьютерную лабораторию при Кембриджском университете, где Карен начала свою карьеру в области информационного поиска.

Диссертация Спаркс на тему «Синонимия и семантическая классификация», написанная в 1964 году, намного опережала свое время, поэтому и была опубликована лишь спустя двадцать лет в статье, посвященной искусственного интеллекту. Диссертация Карен была первым примером применения статистических методов кластеризации для лексических данных. В своих трудах Карен объединяла лингвистику со статистикой и создавала формулы, воплощающие принципы того, как компьютеры могут интерпретировать отношения между словами.

В основе работы современных поисковиков лежит ее концепция обратной частоты документов, определяющая важность термина на основе его употребляемости в конкретном документе.

Карен Джонс внесла огромный вклад в области обработки естественного языка и информационного поиска. За свою работу она удостоилась Премии Жерара Солтона и Медали Лавлейса от Британского компьютерного общества. В 1994 году Карен стала президентом Ассоциации вычислительной лингвистики, а в 1999 году ее пригласили в Кембридж на должность профессора.

На протяжении всей своей жизни Карен Спарк старалась привлечь женщин к работе в области информатики, каждый раз повторяя, что «информатика слишком важна, чтобы оставлять ее только мужчинам».

Использованные источники: University of Cambridge, CC BY 2.5, https://commons.wikimedia.org/w/index.php?curid=4734533