این پروژه شامل آموزش و فاینتیون مدل BERT فارسی برای تحلیل احساسات جملات فارسی است. هدف دستهبندی جملات به سه کلاس مثبت، منفی و خنثی میباشد.
sentiment-analysis-fa/ ├── data/ │ └── dataset.txt ├── src/ │ ├── train.py │ ├── test_model.py │ └── utils.py ├── fa-sentiment-bert/ ├── requirements.txt └── README.md
- Python 3.7 یا بالاتر
- نصب کتابخانهها:
- (اختیاری) ساخت محیط مجازی:
- برای لینوکس/مک: python -m venv venv source venv/bin/activate
- برای ویندوز: python -m venv venv venv\Scripts\activate
-
نصب کتابخانههای مورد نیاز: pip install -r requirements.txt
-
اجرای آموزش مدل: مدل آموزشدیده در پوشه
fa-sentiment-bert/
ذخیره خواهد شد.
برای تست مدل روی جملات جدید: python src/test_model.py
فایل dataset.txt
باید شامل خطوطی به این صورت باشد:
متن - برچسب
مثال:
این فیلم عالی بود. - مثبت خیلی ناامید شدم. - منفی در حد قیمتش بود. - خنثی
- مدل:
HooshvareLab/bert-fa-base-uncased
- Tokenizer: هماهنگ با مدل فوق
- اطمینان حاصل کنید که هنگام اولین اجرا، اینترنت فعال باشد تا مدل از Hugging Face دانلود شود.
- پس از آموزش، مدل ذخیرهشده مستقیماً برای تست در دسترس است.
- مدل و Tokenizer: HooshvareLab on Hugging Face
- این پروژه برای اهداف آموزشی طراحی شده است.