science >> Wetenschap >  >> anders

Een echt experiment verlicht de toekomst van boeken en lezen

Stel je een oneindig aantal lezingen voor van de boeken die we al hebben. Krediet:Unsplash, CC BY

Boeken veranderen altijd. Het boek dat we vandaag hebben, is via een aantal materialen (klei, papyrus, perkament, papier, pixels) en formulieren (tablet, rol, codex, ontsteken).

Het boek kan een communicatiemiddel zijn, lezing, amusement, of leren; een object en een statussymbool.

De meest recente verschuiving, van gedrukte media tot digitale technologie, begon rond het midden van de 20e eeuw. Het mondde uit in twee van de meest ambitieuze projecten in de geschiedenis van het boek (tenminste als we de corporate hype mogen geloven):de massale digitalisering van boeken door Google en de massale distributie van elektronische boeken door Amazon.

Het voortbestaan ​​van boekhandels en de bloei van bibliotheken (in het echte leven) tart de voorspellingen dat het "einde van het boek" nabij is. Maar zelfs de meest militante bibliofiel zal erkennen hoe digitale technologie het 'idee' van het boek in twijfel heeft getrokken, alweer.

Om het potentieel voor samenwerking tussen mens en machine bij lezen en schrijven te onderzoeken, we hebben een machine gebouwd die poëzie maakt van de pagina's van elk gedrukt boek. uiteindelijk, dit project probeert de toekomst van het boek zelf voor te stellen.

Een machine om boeken te lezen

Onze op maat gecodeerde leesmachine leest en interpreteert echte boekpagina's, om een ​​nieuw "verlicht" dichtbundel te creëren.

De leesmachine gebruikt Computer Vision en Optical Character Recognition om de tekst te identificeren op elk open boek dat onder de dubbele camera's is geplaatst. Het gebruikt vervolgens Machine Learning en Natural Language Processing-technologie om de tekst te "lezen" op betekenis, om een ​​korte poëtische combinatie van woorden op de pagina te selecteren die het opslaat door alle andere woorden op de pagina digitaal te wissen.

Gewapend met dit gegenereerde vers, de leesmachine zoekt op internet naar een afbeelding - vaak een doodle of meme, die iemand heeft gedeeld en die is opgeslagen in Google Afbeeldingen - om het gedicht te illustreren.

Zodra elke pagina in het boek is gelezen, geïnterpreteerd, en geïllustreerd, het systeem publiceert de resultaten met behulp van een online afdrukservice. Het resulterende volume wordt vervolgens toegevoegd aan een groeiend archief dat we The Library of Nonhuman Books noemen.

Vanaf het moment dat onze machine klaar is met lezen tot de levering van het boek, ons geautomatiseerde kunstsysteem gaat algoritmisch te werk - van het interpreteren en belichten van de gedichten, naar paginering, omslagontwerp en tenslotte het toevoegen van de eindmaterie. Dit alles gebeurt zonder menselijke tussenkomst. Het algoritme kan een schijnbaar oneindig aantal lezingen van elk boek genereren.

De poëzie

De volgende gedichten werden geproduceerd door de leesmachine uit populaire teksten:

"diep van binnen proberen mannen het daar
hij is groot naakt, ze is zelfs
terwijl je met iets geconfronteerd wordt."

van EL James' "Vijftig tinten grijs"

"hoe feestjes popcorn"
jukebox badkamers depressief
schouderophalend, Ja? alle."

uit Bret Easton Ellis' "The Rules of Attraction"

"Oh en haar slaapkamer
badkamer poetsen opsturen
kousenband ook geconfronteerd met de hel."

van Truman Capote's <"a href="https://www.goodreads.com/book/show/251688.Breakfast_at_Tiffany_s"> Ontbijt bij Tiffany's"

mijn algoritme, mijn muze

Dus wat heeft dit alles te maken met de massale digitalisering van boeken?

Geconfronteerd met toenemende weerstand van auteurs en uitgevers die zich bezighouden met het beheer van auteursrechten door Google, het infoglomeraat wendde zich af van zijn primaire doel om een ​​gratis corpus van boeken te bieden (een soort moderne bibliotheek van Alexandrië) en naar een meer bescheiden indexsysteem dat werd gebruikt voor het zoeken in de boeken die Google had gescand. Google zou nu alleen korte "fragmenten" weergeven van woorden die op de oorspronkelijke pagina waren gemarkeerd.

Achter de schermen, Google had een ander gebruik voor de teksten geïdentificeerd. Miljoenen gescande boeken zouden kunnen worden gebruikt in een veld dat natuurlijke taalverwerking wordt genoemd. NLP stelt computers in staat om met mensen te communiceren in alledaagse taal in plaats van code. De boeken die oorspronkelijk op mensen werden gescand, werden ter beschikking gesteld aan machines om te leren, en later imiteren, menselijke taal.

Algoritmische processen zoals NLP en Machine Learning houden de belofte (of dreiging) in om een ​​groot deel van ons dagelijks lezen uit te stellen aan machines. De geschiedenis heeft aangetoond dat als machines eenmaal weten hoe ze iets moeten doen, we laten ze er meestal aan over. De mate waarin we dit doen, hangt af van hoeveel we lezen belangrijk vinden.

Als we ons lezen (en schrijven) blijven uitstellen aan machines, we zouden literatuur kunnen maken met onze kunstmatig intelligente tegenhangers. Wat zal poëzie worden, met een algoritme als onze muze?

We hebben hier al aanwijzingen voor:van het bijna verplichte gebruik van emoji's of Japanse Kaomoji (顔文字) als visuele afkorting voor de emotionele bedoeling van onze digitale communicatie, naar de gelaagde betekenissen van internetmemes, tot het automatisch genereren van "nepnieuws" -verhalen. Dit zijn de beeld-woord-hybriden die we vinden in post-geletterde sociale media.

Om een ​​blad te verbergen

Neem het boek, mijn vriend, en lees je ogen uit, je zult daar nooit vinden wat ik vind.

De spirituele wetten van Ralph Waldo Emerson

De uitdaging van Emerson benadrukt de subjectiviteit die we bij het lezen brengen. When we started working on the reading-machine we focused on discovering patterns of words within larger bodies of texts that have always been there, but have remained "hidden in plain sight." Every attempt by the reading-machine generated new poems, all of them made from words that remained in their original positions on the pages of books.

The notion of a single book consisting of infinite readings is not new. We originally conceived our reading-machine as a way of making a mythical Book of Sand, described by Jorge Luis Borges in his 1975 parable.

Borges' story is about the narrator's encounter with an endless book which continuously recombines its words and images. Many have compared this impossible book to the internet of today. Our reading-machine, with the turn of each page of any physical book, calculates combinations of words on that page which, until that moment, have been seen, but not consciously perceived by the reader.

The title of our early version of the work was To Hide a Leaf. It was generated by chance when a prototype of the reading-machine was presented with a page from a book of Borges' stories. The complete sentence from which the words were taken is:

"Somewhere I recalled reading that the best place to hide a leaf is in a forest."

The latent verse our machine attempts to reveal in books also hides in plain sight, like a leaf in a forest; and the idea is also a play on a page being generally referred to as a "leaf of a book."

Like the Book of Sand, perhaps all books can be seen as combinatorial machines. We believed we could write an algorithm that could unlock new meanings in existing books, using only the text within that book as the key.

Philosopher Boris Groys described the result of the mass-digitization of the book as Words Without Grammar, suggesting clouds of disconnected words.

Our reading-machine, and the Library of Nonhuman Books it is generating, is an attempt to imagine the book to come after these clouds of "words without grammar." We have found the results are sometimes comical, often nonsensical, occasionally infuriating and, every now and then, even poetic.

Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.