15 мая 2018 г. Выступление Виталия Мерсо (Tepper School of Business, Carnegie Mellon University) на семинаре имени С. Л. Печерского

 
22.05.2018
 
Факультет экономики

15 мая 2018 года Виталий Мерсо (Vitaly Mersault), выпускник факультета экономики ЕУСПб (выпуск 2015 г.), а в настоящее время PhD студент университета Карнеги–Меллон (Tepper School of Business, Carnegie Mellon University) на исследовательском семинаре имени С. Л. Печерского представил доклад «Can You Tell Me What Happened?» Mutual Fund Shareholder Letters and the Economy.

Паевые инвестиционные фонды (mutual funds) представляют собой форму совместных инвестиций. Инвестиционная компания, которая организовала такой фонд, продает паи (доли) инвесторам, вкладывая полученные средства в сформированный портфель ценных бумаг, а инвесторы получают прибыль пропорционально паям (вложенным средствам), если доходность портфеля растёт.

В США одним из традиционных средств коммуникации между управляющими паевыми инвестиционными фондами и самими инвесторами являются сопроводительные письма. Содержание таких писем никем не регулируется и не определяется, они пишутся в свободной форме и очень часто включают в себя описание состояния экономики. В своём исследовании Виталий Мерсо задаётся вопросом, можно ли использовать текст этих писем для оценки состояния экономики и более детального изучения поведения инвесторов. Среди прочего, интересно, каким языком описываются хорошие и плохие состояния экономики и какими свойствами должно обладать сопроводительное письмо, чтобы оказать влияние на решение инвесторов, например, стимулировать их больше вкладывать деньги в фонд.

Ответы на поставленные вопросы планируется получить с помощью модели классификации текстов под названием Hierarchical Attention Network (HAN). Данная модель позволяет работать с текстом как с данными, распознавая нужные фрагменты, слова и предложения. Для того чтобы достичь результата в поставленной задаче, модель должна «понимать» контекст предложений и слов, отфильтровывать ненужные фрагменты текста (шаблонные выражения) и справляться с объёмными документами.

Модель HAN работает по принципу иерархии — она кодирует сначала слова, потом предложения, а затем и весь текст в векторный формат. Не все слова в предложении передают главную мысль, поэтому после кодирования слов в векторы им приписываются различные веса. Вектор предложения состоит из взвешенной суммы «аннотации слов». Каждому слову в предложении приписан некоторый вес, чем больше вес, тем выше значимость слова. Аналогичным образом осуществляется обработка предложений, в результате чего получается вектор всего текста. Таким образом, сравнивая разные элементы текста по их весам, модель способна выделять самые важные для содержания текста участки (слова или предложения).

По состоянию на данный момент, работа с моделью ещё продолжается, но первые результаты исследования сопроводительных писем менеджеров инвестиционных фондов показывают, что модель HAN может успешно различать письма, написанные в периоды подъёмов и спадов в экономике.

Текст: Ирина Львова. Фото: Shan Xiao