הקדמה לראית מכונה |
זיהוי צורה בתמונה הוא תחום הנדסי המנסה לחקות את פעולתם המשולבת של העין והניתוח המהיר שמבצע המוח לתמונה הנקלטת בה. אם לדוגמה, מעוניינים להקים ארכיון ממוחשב, לתוכו יוכנס כל מסמך שנכתב אי פעם בארגון מסוים. ברור כי ניתן לגייס לשם) כך קלדניות על מנת להזין את כל המסמכים למחשב. אולם צילום המסמכים והזנתם למחשב על ידי מכונה המזהה תווים אלפאנומריים, תתבצע בזמן קצר בהרבה, ובדרך כלל במחיר כלכלי זעום.
כדי להשיג שילוב מעין זה יש להקנות למכונה "אינטליגנציה" מסוימת. מכיוון שאינטליגנציה היא מילה מעורפלת במקצת, נהוג להגדיר אותה במספר דרישות מקובלות בהקשר של זיהוי תמונה : 1. היכולת לשלוף מידע רלוונטי מתוך רקע עם פרטים לא רלוונטיים. 2. היכולת להגיע להחלטה נכונה גס אם המידע אינו שלם. 3. היכולת ללמוד או "לצבור ניסיון" על מנת לעשות הכללות, ולהגדיל בתוך כך את רמת הביטחון או הידע. במשך השנים קיבל התחום תאוצה, ופורסמו עבודות רבות שהציעו שיטות מגוונות לזיהוי. לרוב השימושים בזיהוי תמונה הם בתחום הראיה המלאכותית והרובוטיקה, אוטומציה, זיהוי כתב, זיהוי אלמנטים בתמונות, וזיהוי מטרות. אומנם יש הצלחות לא מבוטלות בתחום זה וההתקדמות מהירה, אולם למרות זאת אף אחת מהצלחות אלו אינן מתקרבות ליכולת האנושית. למשל יש מכונות היכולות לקרוא טקסט מפורמט במהירות גבוה מאד, בהרבה מעבר ליכולת האנושית [1]. עם זאת, אלו הן מערכות מומחה עם שימוש צר אשר אינו ניתן להרחבה או הכללה לתחומים אחרים. את שיטות הזיהוי ניתן לסווג לארבע קטגוריות עיקריות: 1. דטרמיניסטית 2. סטטיסטית 3. אינטליגנציה מלאכותית 4. אסוציאטיביות. בשיטות הזיהוי הדטרמיניסטי מתכוונים לשיטות השוואה פשוטות וישירות. למשל חיסור תמונות או קורלציה. השיטה טובה כאשר אין שינויים גדולים בין התמונות או כאשר לשינוי יש אופי מתמטי מוגדר היטב. כאשר יש הבדל גדול בין התמונות, ניתן לבצע טרנספורמציה ולהציג את התמונות במישור נוח יותר להשוואה. מישורי השוואה ידועים הם מישור פורייה, מישור עיוות גיאומטרי, מישור פראקטי, מישור המומנטים וכו'. אם לדוגמה יש צורך לזהות סיבוב של עצם בתמונה מדויקת מאד, אפשר לבצע טרנספורמציה לקואורדינאטות כדוריות, ולבצע את ההשוואה במישור החדש ביתר קלות. הזיהוי בשיטות הסטטיסטיות מתבסס על השוואת תכונות הסטטיסטיות של התמונות. גם בשיטות אלה נהוג לעבוד במישורים אחרים. דוגמה לתכונות סטטיסטיות מקובלות הן : הסטנוגרמה של רמות אפור, הסטוגרמה של צבעים, הסטנוגרמה של אופייניים. לשיטה מספר שימושים בהם ניתן למצוא זיהוי פגמים במוצר, וזיהוי סוג בד או סיווג סוגי קרקע לפי תצלום. שיטות אינטליגנציה המלאכותית מתייחסות לשיטות לוגיות המקשרות בין כל התכונות השונות בתמונה. אלגוריתם הזיהוי הוא בדרך כלל דמוי עץ החלטה. השיטה טובה בשילוב נתונים מגלאים שונים, שילוב שיטות שונות, ובביצוע החלטה על הזיהוי הסופי. השיטות האסוציאטיביות הן אולי שיטות הזיהוי החזקות ביותר וללא ספק הקשות ביותר למימוש. בשיטה מדובר על השוואת צורות, לעתים בעלות עיוותים גדולים. בניגוד לאינטליגנציה מלאכותית להן יש פורמט לוגי ברור, תהליך זה מבוסס יותר על תהליך למידה שלעתים המתמטיקה בו מורכבת מאד. אחד תדריכם למימוש האסוציאטיביות הוא רשתות עצביות. עבודה זו מתרכזת בזיהוי צורה אינוורינטי לסיבוב הזזה ושינוי קנה מידה. מובן, שאחת הדרישות הבסיסיות ממערכת זיהוי, היא היכולת לבצע זיהוי גם כאשר האובייקט בתמונה מצולם מנקודת מבט שונה. שיטה הזיהוי המוצעת בעבודת משלבת שתי שיטות זיהוי : דטרמנסטית וסטטיוזטית. השיטה מתבססת על טרנספורם דטרמיניסטי, אינוורינטי לסיבוב, הזזה ומתיחה הפועל על התכונות הסטטיסטיות של התמונה וגם על צורת האובייקט בה. אחד הדגשים בעת בנית תהליך הזיהוי, הוא יצירת תהליך ישים, אמין, ומהיר הפועל היטב גם על תמונות אמיתיות. |
© כל הזכויות שמורות למערכת המידע איתן |