Newsle ежедневно анализирует более миллиона записей, чтобы выбрать интересные вам

Новостной сервис Newsle переходит на новый уровень предоставления услуг после получения серьёзной финансовой поддержки. Этот интеллектуальный агрегатор фильтрует записи из социальных сетей, выделяя из них суть и отбрасывая мусор вроде смены статуса.

С появлением интернета изменились привычные способы получения новостей. Публиковать и распространять их в Сети теперь гораздо легче, но отыскать вручную среди тысяч записей интересующие именно вас становится сложнее день ото дня. Именно этим объясняется рост популярности интеллектуальных агрегаторов новостей. Если посмотреть на подобные сервисы с точки зрения инженера, то их задача сводится к обнаружению искомого сигнала при высоком уровне шума. У неё должно быть решение.

Большинство из нас сегодня использует социальные сети как источник новостей со своей системой фильтрации контента. Из Facebook, Twitter, LinkedIn и других лент мы узнаём о наиболее обсуждаемых событиях. Люди читают в первую очередь то, что привлекло внимание других. Мы полагаемся на мнение друзей, продвигаем понравившиеся новости за счёт «лайков» и репостов, а наиболее злободневные темы стараемся вывести в топ.

Это популярные, но не самые эффективные методы обработки новостей. Ленты разделены, в них полно информационного мусора и ограничений настроек отслеживания интересующих событий. Между тем в настоящее время существует множество способов расширенной фильтрации записей — на основе поисковых запросов, указанных интересов, социальной активности, etc.

Например, персонализированный новостной сервис Newsle пытается подобраться интересные новости, анализируя структуру социальных сетей. Его основатели, Аксель Хансен (Axel Hansen) и Иона Varon (Jonah Varon), начали работу над Newsle, когда были магистрантами в Гарварде.

Офис Newsle — начало (фото: newsle.com)

С момента запуска в 2011 году они не только сумели сохранить его на плаву силами малой команды из пяти человек, но и привлекли достаточные инвестиции для уверенного развития. Первоначальный объём финансирования в 2012 году от SV Angel и Lerer Ventures составил и 650 тысяч долларов. Недавно компания получила ещё 1,8 миллиона долларов от медиагиганта Advance Publications.

Причина такой поддержки проста. Сегодня этот новостной сервис отслеживает предпочтения более 100 миллионов человек и обрабатывает свыше миллиона статей ежедневно. Пользовательская база увеличивается в среднем на двадцать процентов в месяц.

Однако для разработчиков Newsle эффективность — это не просто вопрос проблемы масштаба. Между подобными сервисами наблюдается острая конкуренция, и основное преимущество агрегатора должно заключаться в максимально точных механизмах фильтрации.

Интерфейс веб-приложения Newsle (фото: beingyourbrand.com).

С помощью Newsle можно следить также за постами знаменитостей и других людей, которые вам интересны, но вряд ли станут друзьями.

Помимо собственно поиска новостей, Newsle решает сложные проблемы из области непрямой идентификации авторов и обработки естественного языка. Например, в статьях часто встречаются иносказательные выражения и фразеологизмы, которые надо анализировать как неделимые лексические единицы. Устойчивые вводные конструкции — наоборот, следует опустить при автоматическом реферировании, поскольку они не несут самостоятельной смысловой нагрузки.

Другой проблемой автоматической обработки текстов остаётся омонимия — наличие в языке совпадающих по звучанию и написанию слов, имеющих разный смысл. Успешное решение алгоритмами Newsle задачи снятия лексико-семантической омонимии устраняет неоднозначность при автоматической интерпретации выражений.

Что будем искать? Например,ChatGPT

Мы в социальных сетях