Заголовок
Текст комментария*



Обучение в реальных проектах для студентов в области компьютерной лингвистики


Мы достраиваем недостающие связи
В наших проектах пересекаются интересы студентов, бизнеса и науки

Сайт и блог переехали на новый адрес: http://mathlingvo.ru. Ждем вас там!




sergeydmitriev@ahe (Sergey Dmitriev)
21:15 12.12.2007
Доступ: публичный
Рубрики: Examples, Links
Опубликовано в: concept@ahe, main@ahe, mathlingvo@ahe
Конференции Ру

Самоорганизующийся сайт о конференциях и прочих мероприятиях.


Konferencii.RU – Open Directory scientific conferences, exhibitions and seminars

vtqveant@ahe (Константин Соколов)
04:11 03.12.2007
Доступ: публичный
Опубликовано в: mathlingvo@ahe
F-35 first fighter with speech recognition system

“The system could be advanced enough in less than five years to enable a single ground-based controller to fly up to four unmanned aerial vehicles using voice commands supplemented with gestures or touch-panel commands, Mr. Williamson said.”
“But first, the Human Effectiveness team wants the F-35 system to be the best it can be, meaning an error rate of less than two percent to consider the baseline system optimized.”

статья целиком

tanya@ahe (Tatiana Lando)
21:31 15.11.2007
Доступ: публичный
Опубликовано в: mathlingvo@ahe, openspace@ahe
Круглый стол по теме «Информационные системы в искусстве и гуманитарных науках»

1-го декабря кафедра информационных систем проводит круглый стол по теме"Информационные системы в искусстве и гуманитарных науках". Круглый стол состоится по адресу 10-я линия Васильевского острова д. 49 ауд.314 в 14:00
Цель мероприятия – дать возможность студентамрассказать о своей работе, получить опыт публичного выступления, узнатьо том, что происходит в других ВУЗах, завести полезные знакомства.
Если вы:
– являетесь студентом любого ВУЗа Санкт-Петербурга
– участвуете (например, в рамках практики, курсовой или дипломной работы)в разработке и/или эксплуатации какой-либо информационной системы в вышеуказанной сфере (включая системы автоматической обработки текста)
– готовы рассказать о своей работе
Присылайте заявку. Участие бесплатное. Подробности тут.

vtqveant@ahe (Константин Соколов)
17:32 14.11.2007
Доступ: публичный
Опубликовано в: mathlingvo@ahe
ДПФ-2007

В рамках Дней Петербургской Философии-2007 15–17 ноября состоится Вторая Международная молодежная конференция «Искусственный интеллект: философия, методология, инновации» (руководители – Т. В. Черниговская, Э. Ф. Караваев),
а 17-го – семинар «Неклассическая логика: история и современные проблемы» (СПбГУ, факультет философии и политологии, ауд. 159, начало в 11:00). Подробнее здесь.


sergeydmitriev@ahe (Sergey Dmitriev)
14:16 04.11.2007
Доступ: публичный
Рубрики: motivation
Опубликовано в: concept@ahe, main@ahe, mathlingvo@ahe
Все диссертации должны публиковаться в интернете

31.10.2007

Сегодня первый вице-премьер РФ Дмитрий Медведев проводит совещание с членами Высшей аттестационной комиссии (ВАК). Он считает, что в России должен быть список высококвалифицированных специалистов, а все диссертации — полностью доступны в интернете. «Я поддерживаю идею подготовки реестра кадров и погружения в сеть абсолютно всех работ», — сказал Медведев на совещании ВАК. «Страна должна знать своих героев, а сеть бесконечна и не пострадает, если в ней появятся диссертации, особенно когда речь идет о громких именах. Все с удовольствием почитают и оценят. Я имею в виду и чиновников, и бизнесменов, и просто ученых», — пояснил он.

см. далее в Ведомостях

tanya@ahe (Tatiana Lando)
00:18 31.10.2007
Доступ: публичный
Опубликовано в: conference@ahe, mathlingvo@ahe, nlpseminar@ahe
Анонс документа: Семинар по автоматической обработке естественного языка

Задачей данного семинара является познакомить студентов и всех заинтересованных с конкретными отраслями компьютерной лингвистики, а так же с методами (лингвистическими, статистическими, математическими и т.д.), которые применяются при решении перечисленных выше задач. Никаких предварительных знаний не требуется.


Семинар рассчитан на широкую аудиторию, но в первую очередь предназначен для студентов 2–4 курсов лингвистических специальностей и специальностей, связанных с информационными технологиями.


Первый семинар состоится 3 ноября. на тему «Автоматическое извлечение фактов из текста» Татьяна Ландо (ООО «Идеограф») Подробности в nlpseminar@ahe.

sergeydmitriev@ahe (Sergey Dmitriev)
17:26 21.10.2007
Доступ: публичный
Рубрики: Links
Опубликовано в: mathlingvo@ahe
«Ашманов и Партнеры» будет выпускать бумажный журнал о поисковой оптимизации

via SPbIT.ru


Журнал будет ориентирован на тех, кто хочет подробнее узнать о том, что такое оптимизация. Бесплатное издание под названием «Обгон разрешен» будет доставляться по почте. Заказать получение журнала можно, заполнив форму на сайте компании. Сообщается, что журнал будет о SMO и SEO, о контекстной рекламе, издатели обещают интервью, аналитику, советы и примеры, софт, сервисы, тенденции.Первый номер журнала выходит в середине ноября. Первыми его получат участники конференции «Поисковая оптимизация и продвижение сайтов в Интернете’07». В этом номере планируются материалы о плюсах и минусах поисковой оптимизации и контекстной рекламы, об исследовании Яндекса контекстной рекламы в России.

sergeydmitriev@ahe (Sergey Dmitriev)
22:56 13.10.2007
Доступ: публичный
Рубрики: Examples, Links
Опубликовано в: mathlingvo@ahe
Про исправление опечаток и попадание в Яндекс

На Хабре вот такая заметка появилась – про правильный пример трудоустройства в Яндекс (с помощью его улучшения)

bocharov@ahe (Victor Bocharov)
09:46 08.10.2007
Доступ: публичный
Рубрики: Dictionary, Startup, Web2
Опубликовано в: mathlingvo@ahe
Web 2.0 словарь (semantika.lv)

Неким Никитой Селецким запущена платформа для создания словарей. Пока предлагаются 6 направлений перевода между 3 языками: русский, латвийский и английский. Утверждается, что реализованы удобные способы поиска без учёта диакритических знаков. Попробовать мне пока не удалось, т.к. словарь пустой :(((


Подробности тут:


http://semantika.lv/ (собственно словарь)


и тут


http://www.seleckis.lv/archive/events/vnimanie-otkryitie-moego-proekta-semantika-lv (анонс в блоге автора)

sergeydmitriev@ahe (Sergey Dmitriev)
22:58 05.10.2007
Доступ: публичный
Venture Philanthropy

Замечательная статья (с примером из российской действительности) в журнале Robb Report повествует о новом явлении под названием венчурная благотворительность (Venture Philanthropy).


Модель аналогична схеме, приянтой в венчурном бизнесе, с той разницей, что на выходе не финансовый, а социальный капитал.


цитирую статью

что же привлекает благотворителя-инвестора в венчурной филантропии? Во-первых, возможность решать социальные проблемы—причём не одноразовым затыканием дыры, а посредством создания жизнеспособных структур, которые в будущем продолжат работу без финансовой помощи извне. Во-вторых, это путь для тех, кто хочет тратить деньги с умом, точно и эффективно: выгоду для проекта и общества можно подсчитать в реальном финансовом выражении. Но главное заключается всё-таки не в цифрах. Венчурному капиталисту нужна не столько прибыль, сколько победители.

Имхо, такой подход хорошо может сработать с моей идеей об ИТ для НКО

bocharov@ahe (Victor Bocharov)
20:27 30.09.2007
Доступ: публичный
Опубликовано в: mathlingvo@ahe
Исследование «Насколько удобной кажется технология распознавания речи пользователям»

По заказу The Independent Fieldwork Company of Enfield (Лондон) было проведено исследование с целью выяснения отношения потребителей к технологии распознавания речи. В июле-августе 2006 года исследователи провели ряд интервью с самыми разными жителями Великобритании, их продолжительность составляла примерно 30–40 минут.


Подробнее тут: http://www.callcentreworld.ru/article_1038.html

sergeydmitriev@ahe (Sergey Dmitriev)
20:27 30.09.2007
Доступ: публичный
Рубрики: Courses, KickOff, Links, Meetings, PR
Опубликовано в: concept@ahe, main@ahe, mathlingvo@ahe
Семинар от Intel по технологическому предпринимательству

Отчет по посещению семинара «Технологическое предпринимательство – от теории к практике».


Официальная информация от организаторов:

В рамках программы Intel в поддержку высшего образования в России (Intel® Higher Education Program), 24–25 сентября 2007 года в г. Санкт-Петербургe корпорация Intel, Калифорнийский университет (г. Беркли) совместно с Санкт-Петербургским государственным университетом и Советом ректоров Северо-Западного Федерального округа организуют двухдневный методический семинар по вопросам преподавания технологического предпринимательства.

далее см. на сайте Intel


Семинар проходил в Высшей Школе Менеджмента СПбГУ. Ведущие семинара: David Charron и John Danner из Lester Center for Entrepreneurship & Innovation at the University of California, Berkeley http://entrepreneurship.berkeley.edu/ .


Содержание и подача были на высшем уровне. Один из основных посылов семинара «создавайте инфраструктуру для возникновения creative collisions». Много интерактива, вовлечение в процесс, постоянная смена форматов работы, кофебрейки и ланчи удерживали внимание и способствовали как хорошему усвоению материала так и активному установлению контактов между участниками. Вторая половина второго дня была посвященна обмену опытом (а точнее, представлению существующих проектов) петербургских участников семинара.


Порадовал состав. Значительный процент студентов и аспирантов. По организациям (кого заметил) – были представители СПбГУ (А. Н Терехов, И. Н. Граничин, и другие официальные лица, а также студенты и аспиранты – была команда, разрабатывающая роботов для участия в футбольных матчах), ИТМО (проект «QD – cтуденческие исследования» http://qd.ifmo.ru/ октровенно жжог), Финэка (например, компания основанная их студентами http://www.studywork.ru/ ), из неакадемических кругов была Полина Гусева из ПКСД http://www.pksd.spb.ru/

tanya@ahe (Tatiana Lando)
22:00 25.09.2007
Доступ: публичный
Опубликовано в: mathlingvo@ahe
Яндекс объявил конкурс студенческих проектов

Компания Яндекс объявила конкурс на разработку нового Веб-сервиса, который мог бы войти в состав Яндекса.
Предполагается, что сервис будет разрабатывать студенческая команда, допустимо участие аспирантов и других «взрослых».
Победителей ждут денежные призы и, возможно, продолжение работы над сервисом в штате Яндекса.
Подробности на странице конкурса: http://company.yandex.ru/start
Заявки принимаются до конца октября.

navi@ahe (Иван Тарасов)
22:16 23.09.2007
Доступ: публичный
Рубрики: Haskell, Linguistics, Nlp
Опубликовано в: mathlingvo@ahe
Thesis: “Surface realisation: ambiguity and determinism”

Eric Kow опубликовал версию 1.0 своей кандидатской работы:

…It's also not very Haskell-related, aside from the fact that the software inside is written in Haskell. If you are interested, the overall topic area is computational linguistics (natural language processing), specifically, natural language generation.

Вот что-то похожее на abstract из самой кандидатской:

The fundamental goal of natural language generation (NLG) is to translate a communicative goal into natural language. A surface realiser is a small part of a natural language generator. Given a grammar and a meaning representation (often a logical form), the job of a surface realiser is produce the strings which are associated by the grammar with the semantics. Surface realisation is one of the most concrete and therefore one of the more straightforward tasks in generation. Indeed, much of generation research in the past has been about surface realisation and has borne a series of high-quality, reusable surface realisers like RealPro, FUF and KPML, which have all been used to build real world NLG systems.
But while the basics of the task are well understood, much remains to be done. One interesting issue is how a surface realiser should deal with natural language paraphrasing. Paraphrasing is possible because of the simple fact that there is often more than one way to say the same thing. This brings great variety to language, and it allows us to communicate subtle nuances in meaning. It is also a combinatorial nightmare. In this thesis, we are interested in the question of how a surface realiser should deal with paraphrasing.

Кандидатская на двух языках, начало на французском, потом (кажется, более подробно) на английском.


Ещё один приятный момент: доступен репозиторий с исходниками кандидатской (в TeX), притом, надо отметить, написана она очень качественно — хороший пример, на основе которого можно писать свою кандидатскую.

sergeydmitriev@ahe (Sergey Dmitriev)
19:21 23.09.2007
Доступ: публичный
Рубрики: Links, motivation
Опубликовано в: mathlingvo@ahe
Чат-бот SILVIA вдохнёт жизнь в гаджеты

via habrahabr.ru


На конференции Techcrunch40 в Сан-Франциско представители стартапа Cognitive Code заявили о создании нового поколения чат-ботов, способных эффективно анализировать текст и реально определять его смысл. Компания уже зарегистрировала 15 патентов на технологии интеллектуальной обработки натурального языка.


в оригинальном посте скриншот, детали и ссылки, а также бурная дискуссия. В дискуссии я тоже принял участие по поводу применения технологии в детских игрушках – это к вопросу об обучении детей сетевым интеллектом

navi@ahe (Иван Тарасов)
23:07 19.09.2007
Доступ: публичный
Рубрики: Conlangs, Linguistics, Lojban
Опубликовано в: mathlingvo@ahe
словио

Нашёл интересное (см. также slovio) у Змея:


это искусственный панславянский язык. автор поставил перед собой достаточно сложную задачу — создать язык, который был бы понятен без обучения всем славянским народам и, вместе с тем, был бы достаточно простым для изучения не-славянами. судя по testimonials, которые лежат на сайте, и по своим ощущениям (я понимаю, походу, совершенно всё, написанное на словио) — у дядьки это удалось!
интересно, а эсперанто является ли паневропейским? то есть, грубо говоря, поймёт ли любой европеец сказанное на эсперанто без предварительного обучения?..

С матлингвистикой, правда, наверное не связано никак. Хотя, вот есть такой вопрос: а какие алгоритмические идеи можно использовать для построения подобного языка? Что вообще можно полезного „вычислить” при создании языка? Для Ложбана, насколько я знаю, алгоритмически составлялся словарь gismu, на основе похожести на основные языки (китайский, индийский, английский, испанский, русский и, кажется, ещё какой-то), но, думается мне, можно пойти и дальше.

sergeydmitriev@ahe (Sergey Dmitriev)
15:11 10.09.2007
Доступ: публичный
Рубрики: Links
Опубликовано в: mathlingvo@ahe
Microsoft выпустил онлайн-переводчик

Microsoft запустила сервис автоматического перевода, названный Windows Live Translator http://translator.live.com/. Переводчик позволяет переводить тексты, ограниченные 500 словами, а также веб-страницы на английский, русский, немецкий, французский, испанский, португальский, итальянский, корейский, китайский и японский.


Подробности на Хабре

sergeydmitriev@ahe (Sergey Dmitriev)
17:29 29.07.2007
Доступ: публичный
Рубрики: Courses, Links
Опубликовано в: mathlingvo@ahe
Курс «Математическая теория формальных языков»

На сайте INTUIT появился курс «Математическая теория формальных языков».


Курс посвящён классическому разделу математической лингвистики и теоретической информатики – теории формальных языков. Рассматриваются порождающие грамматики, регулярные выражения, конечные автоматы, автоматы с магазинной памятью.

Авторы преподают в МГУ.


Соответсвующая книга тоже издана.

sergeydmitriev@ahe (Sergey Dmitriev)
23:41 28.07.2007
Доступ: публичный
Опубликовано в: main@ahe, mathlingvo@ahe
Кого не хватает в ABBYY

Оказывается ABBYY и технических писателей тоже не хватает:
Цитирую свежий опрос Компьютерры:


Компанию ABBYY не удовлетворяет уровень подготовки, даваемый сегодня вузами России, по всем ИТ-специальностям. Вот их неполный список: системный архитектор, программист, веб-мастер, тестер, интерфейс-дизайнер, дизайнер, кодировщик, системный аналитик, менеджер проекта, маркетинг менеджер, менеджер по внедрению, программист баз данных, администратор баз данных, системный администратор, технический писатель, системный интегратор, бизнес-аналитик, сотрудник техподдержки, специалист по контролю качества программного обеспечения и др.

и про базовую кафедру:

... открыта кафедра «Распознавание изображений и обработка текста» в МФТИ на факультете инноваций и высоких технологий (ФИВТ). На кафедре преподают ведущие ученые и профессиональные преподаватели в области ИТ.
vtqveant@ahe (Константин Соколов)
23:05 28.07.2007
Доступ: публичный
Опубликовано в: mathlingvo@ahe
[Frost 2006]

Richard A. Frost “Realization of Natural Language Interfaces Using Lazy Functional Programming”, 2006. http://cs.uwindsor.ca/~richard/PUBLICATIONS/NLI_LFP_SURVEY_DRAFT.pdf


The construction of natural language interfaces to computers continues to be a major challenge. The need for such interfaces is growing now that speech recognition technology is becoming more readily available, and people cannot speak those computer-oriented formal languages that are frequently used to interact with computer applications. Much of the research related to the design and implementation of natural language interfaces has involved the use of high-level declarative programming languages. This is to be expected as the task is extremely difficult, involving syntactic and semantic analysis of potentially ambiguous input. The use of LISP and Prolog in this area is well documented. However, research involving the relatively new lazy functional programming paradigm is less well known. This paper provides a comprehensive survey of that research.

Many thanks to Barbara Partee for the link