כלי הניתוח המורפולוגי של מיל"ה מקבל כקלט עברית לא מנוקדת בפורמט UTF-8 או בפורמט XML התואם את הסטנדרטים של מילה. המנתח מחזיר לכל תמנית (token) את כל הניתוחים המורפולוגיים האפשריים, ולכל ניתוח ניתן טרנסליטרציה, וציון, לפי העניין, של חלק הדיבר, גוף, מין, מספר, יידוע, סטטוס (נפרד או נסמך) וכינויי קניין חבור.
-
דמו מקוון
יש להכניס עד 100 תמניות של עברית לא מנוקדת:
-
תכנית מלאה
סכמות ה-XML מצייתות לסטנדרטים של מיל"ה.
דרושה סיסמה. אנא הירשמו לקבלת גישה (ללא תשלום לשימושים לא-מסחריים).
-
תיעוד (בעברית)
PDF file, 162 KB.
תודות
- פיתוח: דליה בוז'ן.
- הדקדוק של המנתח פותח ע"י שלמה יונה ושולי וינטנר.
- תחזוקה: יוסי יעקב, מהנדס מחקר (צור קשר).
הרשאות
שימושים לא מסחריים בכלי זה מותרים תחת הרשיון הציבורי הכללי של גנו (GPL). כל פרסום מדעי הנובע משימוש בכלי זה צריך להתייחס אליו כאל "כלי הניתוח המורפולוגי של מיל"ה (MILA Hebrew Morphological Analysis Tool)" ולצטט את המאמרים הבאים:
Alon Itai and Shuly Wintner. "Language Resources for Hebrew." Language Resources and Evaluation 42(1):75-98, March 2008. [BibTeX]
Shlomo Yona and Shuly Wintner. "A Finite-State Morphological Grammar of Hebrew." Natural Language Engineering 14(2):173-190, April 2008. Language Resources and Evaluation 42(1):75-98, March 2008. [BibTeX]
לשימושים מסחריים, אנא צור קשר עם מיל"ה.
