נושאים פעיליםנושאים פעילים  הצגת רשימה של חברי הפורוםרשימת משתמשים  חיפוש בפורוםחיפוש  עזרהעזרה
  הרשמההרשמה  התחברותהתחברות RSS עדכונים
מדעי המחשב
RSS UnderWarrior Forums : RSS מדעי המחשב
נושא

נושא: הבנת שפה טבעית באנגלית

שליחת תגובהשליחת נושא חדש
כותב
הודעה << נושא קודם | נושא הבא >>
אוריה
משתמש חבר
משתמש חבר
סמל אישי

הצטרף / הצטרפה: 29 January 2010
מדינה: Israel
משתמש: מנותק/ת
הודעות: 230
נשלח בתאריך: 03 March 2010 בשעה 21:58 | IP רשוּם
ציטוט אוריה

אני כותב כבר כמה זמן פרוייקט קוד פתוח של הבנת שפה טבעית באנגלית.

הפרוייקט מזהה את כל הפעלים, תארים, תארי הפועל, שמות עצם, מילות קישור ומילות יחס במשפט.

שלב שני - ניתוח תחבירי - כל הצורות באנגלית.

בסוף אני מקבל את המחלקה Sentence, שיש בה את השדות הבאים:

"זמן" מסוג "זמנים"(enum שיש בו את כל הזמנים באנגלית)

"טקסט" מסוג "מחרוזת"(כל המשפט)

"שלילי" מסוג "בוליאני"

"שאלה" מסוג "מחרוזת"(מילת השאלה במשפט)

"תנאי" מסוג "מחרוזת"(החלק של התנאי במשפט)

"תוצאה" מסוג "מחרוזת"(החלק של התוצאה במשפט)

"נושא" ו-"נשוא" מסוג "מחרוזת"

"מושאים" שהוא בעצם מילון כשהמפתח, מסוג "מחרוזת", מכיל את המושא והערך, מסוג "_מושאים"(שהוא בעצם enum של כל המושאים שקיימים כמו ת.זמן)

ו-"רלאטיב קלאוזס" שהוא בעצם רשימה של המחלקה "RelativeClausses" שמכילה "משפט" מסוג Sentence ותיאור תפקיד מסוג "_מושאים"

טוב, כתבתי את כל זה בעברית בגלל שקצת קשה לי עם היישור.
עכשיו, חסר לי מערכת תשובות לשאלות - נגיד שאני יוצר רשימה של Sentence של משפטים ואז שואלים שאלה - צריך לספק את התשובה מתוך המאגר.
מה אתם אומרים? חסר פה משהו קריטי?



__________________
SmartProgramming
נא לא להגיב בשבת על מה שאני כותב

עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
חזרה לתחילת העמוד הצג את כרטיס החבר של אוריה חפש הודעות אחרות של אוריה בקר בדף הבית של אוריה
 
ניר
מנהל האתר
מנהל האתר
סמל אישי

הצטרף / הצטרפה: 12 January 2005
מדינה: Israel
משתמש: מנותק/ת
הודעות: 3296
נשלח בתאריך: 03 March 2010 בשעה 22:01 | IP רשוּם
ציטוט ניר

איך אתה מממש את הבינה המלאכותית והניתוח עצמו? התוכנה מקבלת רק מבנים סטנדרטיים?
+ מה שכתבת לא הכי ברור


__________________
מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
חזרה לתחילת העמוד הצג את כרטיס החבר של ניר חפש הודעות אחרות של ניר בקר בדף הבית של ניר
 
אוריה
משתמש חבר
משתמש חבר
סמל אישי

הצטרף / הצטרפה: 29 January 2010
מדינה: Israel
משתמש: מנותק/ת
הודעות: 230
נשלח בתאריך: 03 March 2010 בשעה 22:18 | IP רשוּם
ציטוט אוריה

הניתוח מילים(פעלים, שמות עצם וכו') - רשימה של פעלי v1 שמהם אפשר "לגזור" עוד פעלים(לדוג': walk - walked) ואם זאת זה מהפעלים המיוחדים אז יש עוד 2 רשימות של V2 ו-V3. תארים - יכולים להיגזר מפועל ויכולים להיות ברשימה וכן הלאה(ראה ספרי בגרות באנגלית).
לגבי ניתוח תחבירי - גם ראה ספרי בגרות באנגלית.
את כל זה עשיתי בעיקר ע"י Regex(שכתבת באיזה מסמך שהוא יכול להיות מאוד איטי... אבל זאת גירסה ראשונה).
אם התכוונת למבנים סטנדרטיים במשפטים אז התשובה היא לא - התוכנה מקבלת כל סוג של משפט.
+יש לי מחר מתכונת באזרחות...


__________________
SmartProgramming
נא לא להגיב בשבת על מה שאני כותב

עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
חזרה לתחילת העמוד הצג את כרטיס החבר של אוריה חפש הודעות אחרות של אוריה בקר בדף הבית של אוריה
 
ניר
מנהל האתר
מנהל האתר
סמל אישי

הצטרף / הצטרפה: 12 January 2005
מדינה: Israel
משתמש: מנותק/ת
הודעות: 3296
נשלח בתאריך: 03 March 2010 בשעה 22:26 | IP רשוּם
ציטוט ניר

רגקס באמת איטי.רגקסים מסובכים שהפכתי לקוד ספציפי -שיפור של יותר מפי 1000 לפעמים


__________________
מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
חזרה לתחילת העמוד הצג את כרטיס החבר של ניר חפש הודעות אחרות של ניר בקר בדף הבית של ניר
 
אוריה
משתמש חבר
משתמש חבר
סמל אישי

הצטרף / הצטרפה: 29 January 2010
מדינה: Israel
משתמש: מנותק/ת
הודעות: 230
נשלח בתאריך: 03 March 2010 בשעה 22:30 | IP רשוּם
ציטוט אוריה

טוב, בגירסא הבאה...
מה אם איזה "בהצלחה במתכונת באזרחות"?


__________________
SmartProgramming
נא לא להגיב בשבת על מה שאני כותב

עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
חזרה לתחילת העמוד הצג את כרטיס החבר של אוריה חפש הודעות אחרות של אוריה בקר בדף הבית של אוריה
 
ניר
מנהל האתר
מנהל האתר
סמל אישי

הצטרף / הצטרפה: 12 January 2005
מדינה: Israel
משתמש: מנותק/ת
הודעות: 3296
נשלח בתאריך: 03 March 2010 בשעה 22:30 | IP רשוּם
ציטוט ניר

בהצלחה במתכונת באזרחות

__________________
מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
חזרה לתחילת העמוד הצג את כרטיס החבר של ניר חפש הודעות אחרות של ניר בקר בדף הבית של ניר
 
ניר
מנהל האתר
מנהל האתר
סמל אישי

הצטרף / הצטרפה: 12 January 2005
מדינה: Israel
משתמש: מנותק/ת
הודעות: 3296
נשלח בתאריך: 03 March 2010 בשעה 22:31 | IP רשוּם
ציטוט ניר

שלחו לי את זה לא מזמן - מכיר?
http://www.nltk.org/


__________________
מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
חזרה לתחילת העמוד הצג את כרטיס החבר של ניר חפש הודעות אחרות של ניר בקר בדף הבית של ניר
 
אוריה
משתמש חבר
משתמש חבר
סמל אישי

הצטרף / הצטרפה: 29 January 2010
מדינה: Israel
משתמש: מנותק/ת
הודעות: 230
נשלח בתאריך: 03 March 2010 בשעה 22:43 | IP רשוּם
ציטוט אוריה

לא. אני אסתכל אחרי זה.
ואתה?


__________________
SmartProgramming
נא לא להגיב בשבת על מה שאני כותב

עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
חזרה לתחילת העמוד הצג את כרטיס החבר של אוריה חפש הודעות אחרות של אוריה בקר בדף הבית של אוריה
 
ניר
מנהל האתר
מנהל האתר
סמל אישי

הצטרף / הצטרפה: 12 January 2005
מדינה: Israel
משתמש: מנותק/ת
הודעות: 3296
נשלח בתאריך: 03 March 2010 בשעה 23:00 | IP רשוּם
ציטוט ניר

עוד לא התעמקתי בזה. אמרו לי ששווה להעיף על זה מבט

__________________
מספר האייסיקיו שלי ו/או כתובת ה-MSN שלי אינם מהווים מוקד תמיכה
חזרה לתחילת העמוד הצג את כרטיס החבר של ניר חפש הודעות אחרות של ניר בקר בדף הבית של ניר
 
אוריה
משתמש חבר
משתמש חבר
סמל אישי

הצטרף / הצטרפה: 29 January 2010
מדינה: Israel
משתמש: מנותק/ת
הודעות: 230
נשלח בתאריך: 03 March 2010 בשעה 23:08 | IP רשוּם
ציטוט אוריה

אני רוצה גם לממש מנגנון תשובות לשאלות. מה אתם אומרים על המנגנון הבא:
שאלות | תשובות
מי        התאמה בין נושא לנושא, מושא למושא ונשוא לנשוא(כשיש מילון שנותן כמה
          משמעויות  לכל שם עצם ופועל) במשפט פועלי ונושא לנשוא וכו' במשפט פאסיבי

אולי יש למישהו הוספות?


__________________
SmartProgramming
נא לא להגיב בשבת על מה שאני כותב

עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
חזרה לתחילת העמוד הצג את כרטיס החבר של אוריה חפש הודעות אחרות של אוריה בקר בדף הבית של אוריה
 
אוריה
משתמש חבר
משתמש חבר
סמל אישי

הצטרף / הצטרפה: 29 January 2010
מדינה: Israel
משתמש: מנותק/ת
הודעות: 230
נשלח בתאריך: 03 March 2010 בשעה 23:13 | IP רשוּם
ציטוט אוריה

נ.ב: אני אנסה גם לעשות אותו דבר בעברית. אבל בעברית קצת קשה לעשות את זה בגלל החובה בניקוד(אני לא חושב שזה אפשרי לעשות את זה בלי ניקוד). ונראה לי שיש פיתרון: זיהוי דיבור מזהה גם את הניקוד באנגלית אז אם יממשו מנגנון חיפוש והחלפה מאנגלית לעברית זה יהיה שיפור(לדוג': Tapuah - תָפוּחַ) כי יש תווים בשפות קלט של אנגלית שנשנמעים כמו הצלילים שחסרים להם בשפה(כמו ח', ע' וכו').
אם יש מנגנון טוב לזיהוי דיבור - יהיה אפשר לעשות את זה בקלות יותר.


__________________
SmartProgramming
נא לא להגיב בשבת על מה שאני כותב

עדיף להשקיע עוד שעה בתיעוד, מלאבד עוד 100 שעות ויותר על שיחזר של כל הפרוייקט מההתחלה..
חזרה לתחילת העמוד הצג את כרטיס החבר של אוריה חפש הודעות אחרות של אוריה בקר בדף הבית של אוריה
 

אם ברצונך להגיב לנושא זה עליך קודם להתחבר
אם אינך רשום/ה כבר עליך להרשם

  שליחת תגובהשליחת נושא חדש
גרסת הדפסה גרסת הדפסה

קפיצה לפורום
אינך יכול/ה לשלוח נושאים חדשים בפורום זה
אינך יכול/ה להגיב לנושאים בפורום זה
אינך יכול/ה למחוק את הודעותיך ותגוביך בפורום זה
אינך יכול/ה לערוך את הודעותיך ותגובותיך בפורום זה
אינך יכול/ה לצור סקרים בפורום זה
אינך יכול/ה להצביע בסקרים בפורום זה