הזיות של מודלי שפה גדולים והשפעתן על ההיגיון המשפטי: בחינת הסיכונים שבאי-דיוקים עובדתיים שנוצרים על ידי בינה מלאכותית בהליכים שיפוטיים

מבוא

מערכת המשפט נשענת על דיוק עובדתי, על תקדימים מוסמכים ועל פרשנות מדויקת של חקיקה. הופעתם של מודלים גדולים לשפה (LLMs) חוללה מהפכה ביכולת לעבד וליצור טקסטים משפטיים, אך במקביל יצרה סכנות חדשות. מודלים אלה מסוגלים להפיק טקסטים שנראים מקצועיים ומבוססים, אך לעיתים כוללים "הזיות" – כלומר, פרטים מומצאים או בלתי ניתנים לאימות. כאשר עורכי דין או שופטים מסתמכים על תוצרים כאלה לצורכי חיפוש ראיות או בניית טיעונים, הם עלולים לשלב בטעות מידע חסר בסיס עובדתי. כך נוצר איום על שלמות ההליך המשפטי ועל אמון הציבור במערכת.

המאמר מצביע על כך שהשימוש הגובר בכלי בינה מלאכותית להאצת מחקר משפטי ולייעול עבודת עורכי הדין והשופטים חושף את המערכת לסיכון של עיוותים סמויים. טעויות שנראות אמינות עלולות לחלחל אל פסיקות ולהפוך לחלק ממארג התקדים המשפטי. בשל יכולת ההבעה הגבוהה של המודלים, קשה לזהות מתי תוכן כזה מופרך. שילוב בין שיפוט אנושי לסיוע ממוכן מגדיל את הסכנה, במיוחד כשהבדיקה העובדתית רופפת או מתבצעת בלחץ זמן.

הארכיטקטורה הקוגניטיבית של המודלים הגדולים ומקורות ההזיות

מודלים מבוססי טרנספורמר נשענים על מנגנון קשב עצמי (self-attention) הלוכד יחסים הקשריים בין מילים. שכבות מרובות של עיבוד יוצרות ייצוגים סמנטיים מורכבים המשמשים להפקת טקסטים שוטפים וקוהרנטיים. אולם יכולת ההכללה הרבה של המודל גורמת לכך שהוא לעיתים משלים פרטים חסרים מתוך הסתברות, גם כשהם אינם קיימים במידע שאומן עליו.

המאמר מסביר כי תופעת ההזיות נובעת ממספר גורמים: דגימה בהסתברות גבוהה מדי ("טמפרטורה" גבוהה), מורכבות-יתר של המודל (overparameterization), נתוני אימון חלקיים או לא מאומתים, והיעדר מנגנון פנימי לאימות עובדות. מכיוון שהידע במודל מפוזר על פני פרמטרים רבים ואינו מאוחסן כיחידות מידע מופרדות, המערכת אינה מסוגלת לבדוק אמיתות מול מקורות חיצוניים.

כתוצאה מכך נוצרים אזכורים משפטיים מומצאים, מספרים מדויקים לכאורה שאינם קיימים, או ערבוב של פסיקות אמיתיות עם בדיות. בעיה זו מתחדדת בתחום המשפט, שבו שינוי מילה אחת או טעות בציטוט עלולים לשנות משמעות משפטית שלמה. גם כאשר נעשים ניסיונות לסנן מידע שגוי בשלב איסוף הנתונים, נפח המידע העצום שמוזן למודלים מבטיח שתיוותר בו מידה של שגיאות ולפיכך גם פוטנציאל להפקת תוכן מדומיין.

מנגנוני ההזיות בהקשרים משפטיים

בתחום המשפט מתגלות ההזיות בדרכים מובחנות. אחת הנפוצות היא יצירת הפניות מדומות לפסקי דין. המודל מרכיב שמות תיקים, מספרי כרכים ועמודים לפי תבניות שהוא למד, גם כשהם אינם קיימים. כך נוצרות אסמכתאות שנראות אמינות, אך אינן ניתנות לאיתור במציאות. שימוש בהן עלול להטות טיעונים ואף החלטות.

מנגנון נוסף הוא ערבוב פרוצדורות בין שיפוטים שונים. כאשר המודל מאומן על מקורות מאזורים משפטיים מגוונים, הוא עלול למזג כללים שונים לכדי הליך חדש שאינו תואם אף מערכת משפט קיימת. גם ערבוב שיטות פרשנות – למשל שילוב בין גישות טקסטואליות לתכליתיות – עלול ליצור הסברים חדשים שאין להם תוקף אמיתי.

המאמר מתאר גם יצירת עדויות מדומיינות, שבה המודל מייצר תיאורים שנראים כמו עדות או ראיון, אך מעולם לא התקיימו. טקסטים אלה עלולים להשתלב בקלות במסמכים משפטיים וליצור רושם של ראיה קיימת. בנוסף קיימות טעויות בסיכום פסיקות, שבהן אלגוריתם הסיכום ממזג בין פסקי דין שונים ויוצר ניתוח שאינו מייצג אף אחד מהם.

עוד מתוארות אשליות חיזוי, כאשר מודלים מנסים לנבא תוצאות של תיקים ומסיקים מסקנות על סמך קורלציות סטטיסטיות לא מבוססות. התוצאה עלולה להוביל עורכי דין לאסטרטגיות שגויות. המאמר מוסיף כי מחסור בנתונים ייעודיים לתחום המשפט מגביר את ההסתמכות של המודל על המצאות, ושהמודל נוטה לטשטש היררכיות של סמכות בין פסיקות, כך שפסק דין זוטר מוצג כבעל משקל של פסיקה עליונה.

לבסוף נידונה בלבול רטורי, שבו סגנון כתיבה של ערכאה אחת מושתל בטקסט של אחרת, מה שמקנה מראית עין של סמכות או פורמליות ומסתיר את חוסר הדיוק. כל המנגנונים הללו יוצרים מארג של טעויות שיטתי, הנראה לכאורה אמין ותקני אך מחדיר עיוותים לרקמת ההיגיון המשפטי.

ad

השפעת ההזיות על תוצאות שיפוטיות

השלכות ההזיות חודרות לכל שלבי ההליך המשפטי. שופטים מסתמכים על סיכומים שנערכו על ידי עורכי דין או עוזרים משפטיים, ולעיתים משלבים קטעים מהם בפסקי הדין. אם המסמכים הללו כוללים הפניות מומצאות או פרשנויות שגויות, ההחלטות עצמן עלולות להתבסס על שגיאות עובדתיות. במקרים כאלה נפגעת אמינות ההליך וגדל העומס על מערכת הערעורים.

כאשר טעות כזו נרשמת בפסק דין של ערכאה גבוהה, היא עלולה להפוך לתקדים שווא. ציטוטים חוזרים של אותו עיוות עשויים להעניק לו תוקף מצטבר וליצור עקרון משפטי מדומיין. כך נוצר סיכון למיסוד טעויות בתוך ההיסטוריה המשפטית.

במישור העובדתי, גם זיוף עדויות או הפניות למחקרים מדעיים מומצאים עלולים להשפיע על הכרעות מושבעים ועל הערכת ראיות. האמון בראיות ובחוות דעת מומחים נפגע כאשר אין מקור אמיתי לדברים. בנוסף, המאמר מדגיש את ההיבט הפסיכולוגי: בני אדם נוטים להעדיף נרטיבים קוהרנטיים. כיוון שמודלים מייצרים טקסטים עקביים ומשכנעים, יש נטייה לקבל את דבריהם גם ללא בדיקה מעמיקה.

ברמת הערעור, ניתוח מוטעה של טיעונים שמקורם בהזיות עלול להביא להחלטות סותרות ולהכביד על המערכת כולה. גם יחסי עורך דין–לקוח נפגעים, כאשר מתברר שטענות שהוצגו מבוססות על מקורות מדומיינים. במקרים כאלה עשויה להתעורר טענה לרשלנות מקצועית.

המאמר מתייחס גם לתיקים חוצי גבולות, שבהם ערבוב בין שיטות משפט שונות מחמיר את הבעיה: הפניה לדין זר או פסיקה שאינה רלוונטית עלולה לשבש אכיפת פסקי דין בינלאומית. מעבר לכך, גם עולם המחקר האקדמי אינו חסין – חוקרים המשתמשים בכלים אוטומטיים לציטוט או לסיכום עלולים להפיץ מראי מקום מומצאים, ובכך לזהם את השיח המשפטי כולו.

היבטים אתיים ופרוצדורליים במערכת המשפט

המאמר בוחן את ההשלכות האתיות של התופעה. חובותיהם המקצועיות של עורכי דין כוללות הקפדה על בירור אמיתי של מקורות והצגת מידע מדויק בפני בית המשפט. שימוש חסר ביקורת בתוכן שנוצר על ידי בינה מלאכותית עלול להוות הפרת חובת המקצועיות והיושר.

הסכנה גוברת במערכות ציבוריות ובקרב סנגורים ציבוריים, הפועלים תחת מגבלות זמן ומשאבים. כאשר הם מסתמכים על כלים ממוכנים כדי לחסוך זמן, הסיכון לשילוב מידע שגוי גובר, ופגיעתו הקשה ביותר היא בנאשמים מוחלשים.

גם לתביעה קיימת אחריות כבדה: מודלים שנעשה בהם שימוש בניתוח דו"חות חקירה או ראיות עשויים לייצר או לשנות פרטים באופן לא מדויק, וכך להשפיע על החלטות בענישה. שופטים עצמם עלולים לחרוג מכללי ההליך ההוגן אם יסתמכו על תוכן שמקורו בבינה מלאכותית מבלי לחשוף זאת לצדדים.

המאמר מרחיב גם על ההשלכות המוסדיות. שימוש רשמי במודלים לצורכי ניהול תיקים, ניסוח פסקי דין או תמלול עשוי לזהם את הארכיון המשפטי במסמכים המכילים טעויות. מאגרי המידע של בתי המשפט עלולים לאבד את אמינותם, וכתוצאה מכך תיפגע היכולת להסתמך עליהם בעתיד.

בתחום ההכשרה המשפטית, שילוב הבינה המלאכותית בלימודי משפט דורש חינוך לביקורתיות ולאימות מידע. אם דור המשפטנים החדש יתרגל לבטוח במכונה ללא בדיקה, התופעה תתרחב ותשפיע על כל הדורות הבאים.

לבסוף מדגיש המאמר את הצורך ברגולציה: גופי פיקוח צריכים לחייב את מפתחי הטכנולוגיה בשקיפות, בבדיקת שיעורי טעות ובפיקוח מתמשך לאחר ההפעלה. ללא מנגנוני בקרה מחייבים, האחריות תישאר מעורפלת והנזק יתפשט. מעבר להיבט המשפטי, נשקפת סכנה לפגיעה באמון הציבור במערכת כולה, במיוחד אם יתפשט הרושם שהכרעות מתקבלות על בסיס אלגוריתמים ולא על סמך שיקול דעת אנושי.

ad

סיכום

המאמר מסיים בקביעה כי ההזיות של מודלים לשוניים מהוות סיכון ממשי למערכת המשפט. תופעה זו אינה רק תקלה טכנית אלא ביטוי למגבלות המובנות של ארכיטקטורת הלמידה העמוקה. בהיעדר מנגנון אימות פנימי, המודלים מייצרים טקסטים שנשמעים סמכותיים אך עלולים להיות מנותקים מהמציאות.

במערכת שבה כל מילה קובעת, טעויות אלו עלולות לשנות גורלות. הסתמכות עיוורת על תוצרי בינה מלאכותית עלולה לעוות תקדימים, לפגוע באמון הציבור ולהחליש את עקרון שלטון החוק. לפיכך נדרש פיקוח קפדני, הכשרה מתאימה ואחריות משותפת של עורכי הדין, השופטים, המפתחים והרגולטורים. רק באמצעות שילוב זה ניתן יהיה לנצל את יתרונות הבינה המלאכותית תוך שמירה על יסודות הצדק, הדיוק והאמת העובדתית.

מקור

Latif, Y. A. (2025). Hallucinations in large language models and their influence on legal reasoning: Examining the risks of ai-generated factual inaccuracies in judicial processes. Journal of Computational Intelligence, Machine Reasoning, and Decision-Making10(2), 10-20.

פוסטים אחרונים

נושאים