Вестник On-line
Оренбургский государственный университет 19 ноября 2024   RU/EN
Рубрики Вестника
Педагогика
Психология
Другие

Поиск
Vak
Антиплагиат
Orcid
Viniti
ЭБС Лань
Rsl
Лицензия Creative Commons

2013, № 11 (160)



УДК: 8133:004.056Соловьев Н.А., Чернопрудова Е.Н. ФОРМИРОВАНИЕ УСТОЙЧИВЫХ СЛОВОСОЧЕТАНИЙ В ЗАДАЧЕ КОНТЕНТНОЙ ФИЛЬТРАЦИИ ЭЛЕКТРОННЫХ СООБЩЕНИЙРассмотрены проблемы формирования устойчивых словосочетаний в задаче контентной фильтрации электронных почтовых сообщений. Предложено решение задачи на основе предварительной семантической обработки текста сообщений для использования нейросетевого классификатора. Разработана методика формирования устойчивых словосочетаний, в основу которой положен контент-анализ для формирования тезауруса системы защиты почтовых сервисов служебной переписки. Ключевые слова: электронные почтовые сообщения, семантика текста, контент-анализ, устойчивые словосочетания, интеллектуальная обработка, спам, контентная фильтрация.

Загрузить
Список использованной литературы:

1. Николаев, И.А. Спам: экономические потери [Электронный ресурс]: аналитический доклад / И.А. Николаев, М.В. Титова. — Режим доступа: http://www.fbk.ru/news/5419/83743/.

2. Слепов, О. Контентная фильтрация [Электронный ресурс] / О. Слепов // JetInfo. — 2005. — №10 (149). — Режим доступа: http://www.jetinfo.ru/Sites/new/Uploads/ 2005_10.pdf.

3. Соловьев, Н.А. Развитие концепции обнаружения вторжений / Н.А. Соловьев, Е.Н. Чернопрудова // Современные информационные технологии в науке, образовании и практике: материалы VIII Всерос. науч.-практ. конф., / Оренбург. гос. ун-т. — Оренбург, 2009. — С. 66-67. — ISBN 978-5-7410-0975-8.

3. Чернопрудова, Е.Н. Нейросетевая модель интеллектуальной фильтрации несанкционированных рассылок / Е.Н. Чернопрудова // материалы IХ Всерос. науч.-техн. конф. — Оренбург, 2010. — С. 44-47.

4. Чернопрудова, Е.Н. Интеллектуальная фильтрация несанкционированных рассылок на основе нейронной сети / Е.Н. Чернопрудова, Н.А. Соловьев // Интеллект. Инновации. Инвестиции. — 2011. — Спец. вып. — С. 106-107.

5. McCallum, A. A comparison of Event Models for Naive Bayes Text Classifiection / A. McCallum, K. Nigam // AAAI-98 Workshop on Learning for Text Categorization. — Madison, 1998. — 8 p.

6. Fuernkranz, J. A study using n-gram Features for Text Categorization / J. Fuernkranz // Technical Report OEFAI-TR-98-30, Austrian Research Institute for Artificial Intelligence, Wien, Austria, 1998.

7. Dasigi, V. Neural Net Learning Issues in Classification of Free Text Documents / V. Dasigi, R. Manu // AAAI spring symposium on Machine Learning in Information Access. — 1996.

8. Li, Y.H. Classification of Text Documents /Y. H. Li, A. K. Jain // The Computer Journal. — 1998. — Vol. 41, №8. — P. 537-546.

9. Mingyong, L. An improvement of TFIDF weighting in text categorization [Электронный ресурс] / L. Mingyong, Y. Jiangang. — Режим доступа: http:// www.ipcsit.com/vol47/009-ICCTS2012-T049.pdf.

10. Cover, T. Elements of Information theory [Электронный ресурс] / T. Cover, J. Thomas. — Режим доступа: https:// web.cse.msu.edu/cse842/Papers/CoverThomas-Ch2.pdf.

11. Кондратьев, М.E. Двухуровневая иерархическая кластеризация новостного потока в РОМИП 2006 [Электронный ресурс] / М.E. Кондратьев // Российский семинар по оценке методов информационного поиска: тр. четвертого рос. семинара РОМИП'2006. — Санкт-Петербург, 2006. — С. 126-138. — Режим доступа: http://romip.narod.ru/ romip2006/index.html.

12. Hotho, A. Ontology-based Text Clustering [Электронный ресурс] / A. Hotho, S. Staab, A. Maedche. — Режим доступа: http://www.cs.cmu.edu/mccallum/ textbeyond/papers/hotho.pdf.

13. Supervised and Traditional Term Weighting Methods for Automatic Text Categorization [Электронный ресурс] / M. Lan [and other] // Journal of IEEE pami. — 2007. — Vol. 10, №10, july. — Режим доступа: https://www-old.comp. nus.edu.sg/~tancl/publications/j2009/PAMI2007-v3.pdf.

14. Маннинг, К.Д. Введение в информационный поиск / К. Д. Маннинг, П. Рагхаван, Х. Шютце. — Москва: Вильямс, 2011. — 528 с.

15. Ягунова, Е.В. От коллокаций к конструкциям / Е.В. Ягунова, Л.М Пивоварова // Русский язык: конструкционные и лексико-семантические подходы / отв. ред. С. С. Сай. — Санкт-Петербург, 2011. — С. 137.

16. Хохлова, М.В. Экспериментальная проверка методов выделения коллокаций [Электронный ресурс] / М.В. Хохлова. — Режим доступа: http://www.helsinki.fi/slavicahelsingiensia/preview/sh34/pdf/21.pdf.

17. Теория статистики: учеб.-метод. комплекс / В.Г. Минашкин [и др.] ; Междунар. консорциум "Электронный университет", Моск. гос. ун-т экономики, статистики и информатики, Евраз. открытый ин-т. — Москва: Изд. центр ЕАОИ, 2008. — 296 с. — ISBN 978-5-374-00041-2.

18. Хайкин, С. Нейронные сети: полный курс / С. Хайкин. — Москва: Вильямс, 2006. — 1104 с.

19. Валеев, С. С. Многоуровневая система фильтрации спама на основе технологий искусственного интеллекта / С.С. Валеев, А.П. Никитин // Вестник УГАТУ. — 2008. — Т. 11, №1 (28). — С. 215-219.

20. Гинзбург Е.Л. Идиоглоссы: проблемы выявления и изучения контекста / Е.Л. Гинзбург // Семантика языковых единиц: Доклады VI Международной конференции. Т 1, М., 1998. — С. 26–28.


О статье

Авторы: Соловьев Н.А., Чернопрудова Е.Н.

Год: 2013


Главный редактор
Сергей Александрович
МИРОШНИКОВ

Crossref
Cyberleninka
Doi
Europeanlibrary
Googleacademy
scienceindex
worldcat
© Электронное периодическое издание: ВЕСТНИК ОГУ on-line (VESTNIK OSU on-line), ISSN on-line 1814-6465
Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций
Свидетельство о регистрации СМИ: Эл № ФС77-37678 от 29 сентября 2009 г.
Учредитель: Оренбургский государственный университет (ОГУ)
Главный редактор: С.А. Мирошников
Адрес редакции: 460018, г. Оренбург, проспект Победы, д. 13, к. 2335
Тел./факс: (3532)37-27-78 E-mail: vestnik@mail.osu.ru
1999–2024 © ЦИТ ОГУ