כותב |
|
אוריה משתמש חבר
הצטרף / הצטרפה: 29 January 2010 מדינה: Israel
משתמש: מנותק/ת הודעות: 230
|
נשלח בתאריך: 03 March 2010 בשעה 21:58 | | IP רשוּם
|
|
|
|
אני כותב כבר כמה זמן פרוייקט קוד פתוח של הבנת שפה טבעית באנגלית.
הפרוייקט מזהה את כל הפעלים, תארים, תארי הפועל, שמות עצם, מילות קישור ומילות יחס במשפט.
שלב שני - ניתוח תחבירי - כל הצורות באנגלית.
בסוף אני מקבל את המחלקה Sentence, שיש בה את השדות הבאים:
"זמן" מסוג "זמנים"(enum שיש בו את כל הזמנים באנגלית)
"טקסט" מסוג "מחרוזת"(כל המשפט)
"שלילי" מסוג "בוליאני"
"שאלה" מסוג "מחרוזת"(מילת השאלה במשפט)
"תנאי" מסוג "מחרוזת"(החלק של התנאי במשפט)
"תוצאה" מסוג "מחרוזת"(החלק של התוצאה במשפט)
"נושא" ו-"נשוא" מסוג "מחרוזת"
"מושאים" שהוא בעצם מילון כשהמפתח, מסוג "מחרוזת", מכיל את המושא והערך, מסוג "_מושאים"(שהוא בעצם enum של כל המושאים שקיימים כמו ת.זמן)
ו-"רלאטיב קלאוזס" שהוא בעצם רשימה של המחלקה "RelativeClausses" שמכילה "משפט" מסוג Sentence ותיאור תפקיד מסוג "_מושאים"
טוב, כתבתי את כל זה בעברית בגלל שקצת קשה לי עם היישור. עכשיו, חסר לי מערכת תשובות לשאלות - נגיד שאני יוצר רשימה של Sentence של משפטים ואז שואלים שאלה - צריך לספק את התשובה מתוך המאגר. מה אתם אומרים? חסר פה משהו קריטי?
__________________ SmartProgramming
נא לא להגיב בשבת על מה שאני כותב
עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
|
חזרה לתחילת העמוד |
|
|
ניר מנהל האתר
הצטרף / הצטרפה: 12 January 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 3296
|
נשלח בתאריך: 03 March 2010 בשעה 22:01 | | IP רשוּם
|
|
|
|
איך אתה מממש את הבינה המלאכותית והניתוח עצמו? התוכנה מקבלת רק מבנים סטנדרטיים? + מה שכתבת לא הכי ברור
__________________ מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
|
חזרה לתחילת העמוד |
|
|
אוריה משתמש חבר
הצטרף / הצטרפה: 29 January 2010 מדינה: Israel
משתמש: מנותק/ת הודעות: 230
|
נשלח בתאריך: 03 March 2010 בשעה 22:18 | | IP רשוּם
|
|
|
|
הניתוח מילים(פעלים, שמות עצם וכו') - רשימה של פעלי v1 שמהם אפשר "לגזור" עוד פעלים(לדוג': walk - walked) ואם זאת זה מהפעלים המיוחדים אז יש עוד 2 רשימות של V2 ו-V3. תארים - יכולים להיגזר מפועל ויכולים להיות ברשימה וכן הלאה(ראה ספרי בגרות באנגלית). לגבי ניתוח תחבירי - גם ראה ספרי בגרות באנגלית. את כל זה עשיתי בעיקר ע"י Regex(שכתבת באיזה מסמך שהוא יכול להיות מאוד איטי... אבל זאת גירסה ראשונה). אם התכוונת למבנים סטנדרטיים במשפטים אז התשובה היא לא - התוכנה מקבלת כל סוג של משפט. +יש לי מחר מתכונת באזרחות...
__________________ SmartProgramming
נא לא להגיב בשבת על מה שאני כותב
עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
|
חזרה לתחילת העמוד |
|
|
ניר מנהל האתר
הצטרף / הצטרפה: 12 January 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 3296
|
נשלח בתאריך: 03 March 2010 בשעה 22:26 | | IP רשוּם
|
|
|
|
רגקס באמת איטי.רגקסים מסובכים שהפכתי לקוד ספציפי -שיפור של יותר מפי 1000 לפעמים
__________________ מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
|
חזרה לתחילת העמוד |
|
|
אוריה משתמש חבר
הצטרף / הצטרפה: 29 January 2010 מדינה: Israel
משתמש: מנותק/ת הודעות: 230
|
נשלח בתאריך: 03 March 2010 בשעה 22:30 | | IP רשוּם
|
|
|
|
טוב, בגירסא הבאה... מה אם איזה "בהצלחה במתכונת באזרחות"?
__________________ SmartProgramming
נא לא להגיב בשבת על מה שאני כותב
עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
|
חזרה לתחילת העמוד |
|
|
ניר מנהל האתר
הצטרף / הצטרפה: 12 January 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 3296
|
נשלח בתאריך: 03 March 2010 בשעה 22:30 | | IP רשוּם
|
|
|
|
בהצלחה במתכונת באזרחות
__________________ מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
|
חזרה לתחילת העמוד |
|
|
ניר מנהל האתר
הצטרף / הצטרפה: 12 January 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 3296
|
נשלח בתאריך: 03 March 2010 בשעה 22:31 | | IP רשוּם
|
|
|
|
שלחו לי את זה לא מזמן - מכיר? http://www.nltk.org/
__________________ מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
|
חזרה לתחילת העמוד |
|
|
אוריה משתמש חבר
הצטרף / הצטרפה: 29 January 2010 מדינה: Israel
משתמש: מנותק/ת הודעות: 230
|
נשלח בתאריך: 03 March 2010 בשעה 22:43 | | IP רשוּם
|
|
|
|
לא. אני אסתכל אחרי זה. ואתה?
__________________ SmartProgramming
נא לא להגיב בשבת על מה שאני כותב
עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
|
חזרה לתחילת העמוד |
|
|
ניר מנהל האתר
הצטרף / הצטרפה: 12 January 2005 מדינה: Israel
משתמש: מנותק/ת הודעות: 3296
|
נשלח בתאריך: 03 March 2010 בשעה 23:00 | | IP רשוּם
|
|
|
|
עוד לא התעמקתי בזה. אמרו לי ששווה להעיף על זה מבט
__________________ מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
|
חזרה לתחילת העמוד |
|
|
אוריה משתמש חבר
הצטרף / הצטרפה: 29 January 2010 מדינה: Israel
משתמש: מנותק/ת הודעות: 230
|
נשלח בתאריך: 03 March 2010 בשעה 23:08 | | IP רשוּם
|
|
|
|
אני רוצה גם לממש מנגנון תשובות לשאלות. מה אתם אומרים על המנגנון הבא: שאלות | תשובות מי התאמה בין נושא לנושא, מושא למושא ונשוא לנשוא(כשיש מילון שנותן כמה משמעויות לכל שם עצם ופועל) במשפט פועלי ונושא לנשוא וכו' במשפט פאסיבי
אולי יש למישהו הוספות?
__________________ SmartProgramming
נא לא להגיב בשבת על מה שאני כותב
עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
|
חזרה לתחילת העמוד |
|
|
אוריה משתמש חבר
הצטרף / הצטרפה: 29 January 2010 מדינה: Israel
משתמש: מנותק/ת הודעות: 230
|
נשלח בתאריך: 03 March 2010 בשעה 23:13 | | IP רשוּם
|
|
|
|
נ.ב: אני אנסה גם לעשות אותו דבר בעברית. אבל בעברית קצת קשה לעשות את זה בגלל החובה בניקוד(אני לא חושב שזה אפשרי לעשות את זה בלי ניקוד). ונראה לי שיש פיתרון: זיהוי דיבור מזהה גם את הניקוד באנגלית אז אם יממשו מנגנון חיפוש והחלפה מאנגלית לעברית זה יהיה שיפור(לדוג': Tapuah - תָפוּחַ) כי יש תווים בשפות קלט של אנגלית שנשנמעים כמו הצלילים שחסרים להם בשפה(כמו ח', ע' וכו'). אם יש מנגנון טוב לזיהוי דיבור - יהיה אפשר לעשות את זה בקלות יותר.
__________________ SmartProgramming
נא לא להגיב בשבת על מה שאני כותב
עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
|
חזרה לתחילת העמוד |
|
|