Gulf Dialect Diacritizer

This project was done during SibaqLahja. It was awarded as the best diacritizer. we present a new public diacritized dataset for Gulf Arabic in accordance to the pronounciation of the city of Dubai in the United Arab Emirates (UAE). The dataset is a 19,850 words subset of the Gumar corpus (Khalifa et al., 2018), which is composed of roughly 200 thousand words from Emirati internet novels.

Gulf Dialect Diacritizer

A machine learning model that adds diacritics to Emirati text.

Installation

Use the package manager pip to install foobar.

pip install -r requirements.txt

Usage

Add any nondiacritized emirati text in quotatioins after main.py

python main.py 'السلام عليكم'

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
MODEL		MODEL
Decoder.py		Decoder.py
Preprocess.py		Preprocess.py
README.md		README.md
main.py		main.py
model.py		model.py
requirements.txt		requirements.txt
serve.py		serve.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Gulf Dialect Diacritizer

Installation

Usage

About

Releases

Packages

Languages

Nour-rabih/gulf-Diacritizer

Folders and files

Latest commit

History

Repository files navigation

Gulf Dialect Diacritizer

Installation

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages