science >> Wetenschap >  >> Elektronica

Kunstmatige intelligentie gebruiken om leemten in oude teksten op te vullen

Credit:Ludwig Maximilian Universiteit van München

Enrique Jiménez maakt gebruik van kunstmatige intelligentie om de vele prikkelende hiaten op te vullen in de overgebleven teksten die 3000 jaar geleden op kleitabletten zijn geschreven door schrijvers in vroege stedelijke samenlevingen.

Een enkel teken kan vaak het verschil maken tussen een duidelijke lezing en een raadselachtig raadsel. Enrique Jimenez, een specialist in Oude Nabije Oosten Studies, houdt zich bezig met de reconstructie van het begin van de wereldliteratuur. Mesopotamië was de thuisbasis van de eerste echte beschaving, en rond het jaar 2500 vGT was daar een rijke en tweetalige literaire cultuur verschenen. De teksten zijn geschreven in spijkerschrift op kleitabletten in het Sumerisch en Akkadisch. Deze teksten overleven slechts in fragmentarische vorm, en veel fragmenten zijn slechts enkele centimeters groot. De uitdaging voor Jiménez en zijn collega's is om stukken te identificeren die bij elkaar horen - het script zelf is polyvalent en de semantiek is sterk contextafhankelijk. "Het werk aan een tekst moeten staken omdat er een enkel bordje ontbreekt, is ongelooflijk frustrerend, zeker als je weet dat er ergens een fragment moet zijn dat de leemte opvult."

Enrique Jiménez heeft zichzelf tot doel gesteld om deze pijnlijke hiaten op te vullen met behulp van kunstmatige intelligentie, en hij ontving een Sofia Kovalevskaya-prijs van de Alexander von Humboldt Foundation om hem te helpen dit doel te bereiken. De prijs is bedoeld om junior academici in staat te stellen vernieuwende onderzoeksprojecten te ondernemen op een vakgebied naar keuze. Jiménez koos ervoor om zijn project bij LMU voort te zetten, waar hij een dubbele aanstelling heeft aan het Instituut voor Assyriologie en aan de afdeling Oude Geschiedenis, waar zijn onderzoeksgroep over elektronische Babylonische literatuur is gevestigd. Hij en zijn team zijn begonnen met het samenstellen van een "Fragmentarium, " een database waarin alle tekstfragmenten in wereldmusea hun plek zullen vinden. Het project startte in mei 2018, en de database bevat nu zo'n 10, 000 fragmenten. "Ik hoop tot ongeveer 15 te komen, 000 tegen het einde van het jaar, "zegt hij. Hierdoor kunnen alle niet eerder gepubliceerde fragmenten uit de bibliotheek van de Assyrische koning Assurbanipal in minder dan een seconde worden gelokaliseerd.

40, 000 fragmenten in het British Museum

Assurbanipal bouwde zijn bibliotheek 2700 jaar geleden in zijn hoofdstad Nineveh, met de bedoeling de verzamelde kennis en wijsheid van zijn tijd samen te brengen. Na zijn dood, de bibliotheek werd verwoest door de Babyloniërs die de stad in het jaar 612 vGT veroverden en haar bezittingen werden verbrijzeld. De meeste fragmenten die door archeologen zijn teruggevonden, bevinden zich nu in het British Museum in Londen. Ongeveer de helft hiervan moet nog worden ontcijferd - en Enrique Jiménez heeft deze taak op zich genomen als onderdeel van zijn project, in samenwerking met het Museum. In mei, twee leden van het museumpersoneel begonnen de resterende collecties kleitabletten van de instelling te fotograferen, en Jiménez en zijn groep zullen er 40 hebben, 000 foto's van fragmentarische spijkerschrifttabletten om de komende 5 jaar aan te werken.

Voor jaren, Jiménez heeft de mogelijkheden onderzocht die digitale media bieden. Beginnen met, hij schreef zelf eenvoudige programma's. Nu werkt hij nauw samen met datawetenschappers. Tijdens zijn tijd aan de Yale University, hij was betrokken bij het Cuneiform Commentaries Project, wiens taak het was om online commentaren op de oude Mesopotamische literatuur te publiceren. Ook stelt hij de resultaten van zijn onderzoek beschikbaar op een speciale website. Hij is momenteel bezig met het trainen van het programma om Akkadisch te 'lezen' en alle mogelijke lezingen van de tekens die in Akkadische teksten worden gebruikt, te herkennen. "Het doel is om het programma reeksen karakters te laten herkennen, die het automatisch in de juiste context kan plaatsen. Dit is veel gemakkelijker voor een computer dan voor ons mensen. Een computer kan met alle denkbare mogelijkheden tegelijk rekening houden, en automatisch nieuwe fragmenten vergelijken met eerder opgeslagen teksten." Het directe doel is om teksten die al gedeeltelijk bekend zijn aan te vullen of te reconstrueren, en er zijn plannen om vertalingen in het Engels te publiceren, Duits en Arabisch.

Jiménez zelf richt zich op literaire teksten die in het eerste millennium vGT in omloop waren in wat nu Irak is - toen de Akkadische literatuur in bloei was - en op teksten die in poëtische vormen zijn geschreven. In de loop van het project, Jiménez is van plan te werken aan een tekstcorpus van ongeveer 10, 000 regels. Bij dit streven, hij werkt samen met Dr. Anmar A. Fadhil van de Universiteit van Bagdad, die een archief beheert van literaire tabletten gevonden in de beroemde bibliotheek van Sippar in het noorden van Babylonië. De Griekse historicus Berossos, wiens leven de overgang van de 4e tot de 3e eeuw vGT overspande, legt uit hoe het naar verluidt tot stand is gekomen:toen Noach hoorde dat de zondvloed op handen was, en voordat hij aan boord van de Ark ging, hij zou het hele corpus van Mesopotamische geschriften in de stad Sippar hebben begraven voordat hij aan boord van de Ark ging. Sippar lag vlakbij de plaats van het huidige Bagdad, maar de bibliotheek werd pas in 1986 ontdekt. ​​Onder de teruggevonden teksten bevonden zich het epische "Enuma eliš" (de Babylonische versie van de schepping, en "een heel mooie tekst, " zegt Jiménez) en een verslag van de zondvloed. "Aan de ene kant, deze teksten zijn heel anders dan de verhalen die ons bekend zijn. Op de andere, er zijn veel parallellen, inclusief thematische parallellen, tussen de verschillende versies. Samen met onze Iraakse collega's, we zijn van plan om de belangrijkste literaire tabletten te publiceren. Een daarvan is een fragment van het gedicht over het "Lijden van de Rechtvaardige, "het verhaal van de Babylonische Job."

Het gedicht vertelt het verhaal van een rechtvaardig man, die desondanks herhaalde straffen ondergaat. In het midden van de tekst, de hoofdpersoon wordt eerst gestraft, dan vergeven, en ontvangt het nieuws van de gratie in een droom. Jiménez en Fadhil konden een kort tekstfragment uit de bibliotheek van Sippar toewijzen aan de droomaflevering in het gedicht, daarmee een gat dichten in de eerder bekende versie. "We zijn nu in staat om deze passage te ontcijferen, die niemand de afgelopen 2000 jaar heeft kunnen lezen. We hebben een literaire tekst gereconstrueerd die in de oudheid als klassieker werd erkend, en redde het voor de hedendaagse lezers."

Credit:Ludwig Maximilian Universiteit van München

Jiménez identificeerde ook fragmenten van een hymne gericht aan de Babylonische god Marduk. "De teksten waaraan ik werk zijn poëtische teksten. Akkadische gedichten zijn geschreven in regels met een duidelijk gemarkeerde cesuur in het midden. Het is erg moeilijk om deze poëtische structuur in het Duits te vertalen." In wetenschappelijke publicaties de teksten worden normaal gesproken woord voor woord in het Engels vertaald. Enrique Jiménez heeft de opnieuw samengestelde en nu intacte lijnen in het Duits vertaald, en de onderstaande Engelse versie is een gratis weergave van die tekst (de nieuw ontdekte zinnen worden cursief weergegeven):

"Marduk, je woede is als een razende vloed,
Maar in de ochtend, uw barmhartigheid geeft troost aan je slachtoffer ,
De angstaanjagende en angstaanjagende storm is afgenomen ,
Waar de golven donderden, de kust is nu kalm ,
De donkere dreigende wolk je hebt nu verlicht .
Waar de verschroeiende wind blies, jouw heldere dag regeert nu ."

Onderzoekers kunnen veel leren van deze teksten over het dagelijks leven in het oude Mesopotamië - over de voorwerpen die ze elke dag hanteren en over het sociale leven in het algemeen. "Het lijden van de rechtvaardige man" beschrijft hoe de hoofdpersoon wakker wordt en met zijn entourage spreekt - en de passage laat zien dat hij een dienaar heeft wiens taken inhielden dat hij zijn meester 's ochtends wakker moest maken.

"Ook qua functie Babylonische literatuur is niet zo ver verwijderd van de onze, " zegt Jiménez. De klassieke werken werden voortdurend gekopieerd, grotendeels omdat ze dienden als bronnen van voorbeeldige passages voor het onderwijs in lezen en schrijven op scholen. Maar het Creation Epic werd in het openbaar voorgedragen op het festival dat traditioneel werd gehouden om de komst van het nieuwe jaar te vieren. Ook de Babylonische klassiekers ondergingen een lot dat tot op de dag van vandaag bekend is:ze werden vaak geparodieerd. "Deze parodieën vertellen ons veel over de relatie tussen de mensen van Mesopotamië en hun eigen tradities. een regel in het "Lijden van de rechtvaardige man" is enigszins aangepast om er een grap van te maken. We hebben een zeer vergelijkbare houding ten opzichte van onze literaire tradities in de moderne wereld. Aan de ene kant, de klassiekers worden zeer gerespecteerd, en tegelijkertijd kun je ermee spelen."

Helaas, er zijn veel hiaten in de bestudeerde parodieën, omdat zo veel van de tabletten ooit schade hebben opgelopen. "Ik ben zeker dat, met behulp van de computer, we zullen de komende 40 tot 50 jaar de hele Akkadische literatuur kunnen reconstrueren. Voor ons, digitale media zijn gewoon hulpmiddelen:we werken niet aan abstracte algoritmen. We willen ze gebruiken om de opgenomen teksten vast te stellen. Zonder kennis van zijn literaire klassiekers, het is onmogelijk om enige beschaving te begrijpen."