GitHub - nfilin480/sentiment_analysis_lenta: Sentimental classification of news resources "Lenta". Labels: positive, neutral, negative.

Сентиментный анализ новостей lenta.ru (3 labels: negative, neutral, positive)

Собранные данные для анализа: с 01.2020 по 12.2023

Метрика качества: f1-macro В качестве данных для дообучения моделей Bert-семейства использовались различные датасеты в открытом доступе на русском языке (по 5к данных каждого класса).

sentiment_analysis.py (finetune_bert_sentiment.py)- скрипт для дообучения моделей bert.
syntax_analyzer.py - скрипт для предобработки текста.
nohup.out - вывод лучшей модели
lenta-ru-parser.py - парсер данных с сайта lenta.ru
get_sentiment.py - запуск дообученной модели для разметки данных lenta.ru
sentiment_graph.ipynb - полученное распределение классов после анализа.

Лучшие результаты: модель - xlm-roberta-base f1-macro - 0.74

Протестированные модели: bert-base-multilingual-uncased(cased), distilbert-base-multilingual-cased, bert-large-uncased

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Сентиментный анализ новостей lenta.ru (3 labels: negative, neutral, positive)

Собранные данные для анализа: с 01.2020 по 12.2023

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
r_project		r_project
README.md		README.md
analyze_data.ipynb		analyze_data.ipynb
finetune_bert_sentiment.py		finetune_bert_sentiment.py
get_sentiment.py		get_sentiment.py
lenta-ru-parser.py		lenta-ru-parser.py
nohup.out		nohup.out
preprocess.ipynb		preprocess.ipynb
sentiment_analysis.py		sentiment_analysis.py
sentiment_graph.ipynb		sentiment_graph.ipynb
syntax_analyzer.py		syntax_analyzer.py

Folders and files

Latest commit

History

Repository files navigation

Сентиментный анализ новостей lenta.ru (3 labels: negative, neutral, positive)

Собранные данные для анализа: с 01.2020 по 12.2023

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages