Science >> Wetenschap >  >> Biologie

Analyse van miljarden Twitter-woorden laat zien hoe Amerikaans Engels zich ontwikkelt

Titel: Analyse van miljarden Twitter-woorden onthult hoe Amerikaans-Engels zich ontwikkelt

Samenvatting:

Deze studie biedt een grootschalige analyse van de ontwikkeling van het Amerikaans-Engels, waarbij gebruik wordt gemaakt van gegevens van miljarden woorden die tussen 2008 en 2020 op Twitter zijn gepost. We onderzoeken hoe de frequentie en gebruikspatronen van woorden in de loop van de tijd veranderen, inclusief de opkomst van nieuwe woorden, de achteruitgang van oude, en verschuivingen in de betekenis van woorden. Onze bevindingen werpen licht op de dynamische aard van taal en bieden inzicht in de culturele, sociale en technologische factoren die de evolutie van Amerikaans Engels vormgeven.

Zoekwoorden: Amerikaans Engels, Twitter-gegevens, taalverandering, woordfrequentie, semantische verschuiving

Inleiding:

Taal is een dynamisch fenomeen dat in de loop van de tijd voortdurend verandert. Nieuwe woorden worden geïntroduceerd, oude woorden raken buiten gebruik en bestaande woorden kunnen van betekenis veranderen. Deze veranderingen worden beïnvloed door een verscheidenheid aan factoren, waaronder culturele, sociale, technologische en ecologische veranderingen.

De afgelopen jaren heeft de beschikbaarheid van grootschalige digitale tekstgegevens onderzoekers in staat gesteld taalveranderingen in ongekend detail te bestuderen. Vooral Twitter biedt een rijke gegevensbron voor het realtime analyseren van taalgebruik. Met miljoenen gebruikers die actief berichten plaatsen op het platform, biedt Twitter een kijkje in de huidige staat van het Amerikaans-Engels en hoe deze zich ontwikkelt.

Methodologie :

Om de ontwikkeling van Amerikaans-Engels op Twitter te analyseren, hebben we een dataset van miljarden woorden verzameld die tussen 2008 en 2020 zijn gepost. We hebben de gegevens eerst voorbewerkt door niet-Engelse woorden, interpunctie en URL's te verwijderen. Vervolgens hebben we de tekst in woorden omgezet en de frequentie van elk woord in elk jaar geteld.

Om de verandering in woordfrequentie in de loop van de tijd bij te houden, hebben we de groeisnelheid van de woordfrequentie berekend, gedefinieerd als het procentpunt van de verandering in woordfrequentie van het ene jaar op het andere.

Bovendien hebben we technieken voor het insluiten van woorden gebruikt om de semantische gelijkenis tussen woorden vast te leggen. Met behulp van een vooraf getraind woordinbeddingsmodel berekenden we de cosinusovereenkomst tussen woordvectoren en vergeleken we de semantische verwantschap van woorden in de loop van de tijd.

Bevindingen:

1. Opkomst van nieuwe woorden:

We ontdekten dat er tijdens de onderzoeksperiode duizenden nieuwe woorden op Twitter verschenen. Veel van deze woorden hadden betrekking op nieuwe technologieën, sociale media en populaire cultuur, en weerspiegelden het snelle tempo van technologische vooruitgang en culturele veranderingen.

2. Verval van oude woorden:

Bepaalde woorden namen in de loop van de tijd af in frequentie, wat wijst op een verschuiving in hun gebruik of relevantie. Sommige geweigerde woorden hadden betrekking op verouderde technologieën, modetrends of politieke figuren.

3. Semantische verschuiving:

Onze analyse onthulde ook semantische verschuivingen in de betekenis van bepaalde woorden in de loop van de tijd. Het woord 'letterlijk' betekende bijvoorbeeld oorspronkelijk 'in letterlijke zin', maar het gebruik ervan op Twitter bracht vaak een nadruk of overdrijving over.

4. Invloed van sociale en culturele evenementen:

Grote sociale en culturele evenementen hadden een aanzienlijke impact op het taalgebruik. Het woord ‘selfie’ zag bijvoorbeeld een dramatische toename in frequentie als gevolg van de opkomst van fotografie met mobiele telefoons en het gebruik van sociale mediaplatforms zoals Instagram.

Conclusie:

De analyse van miljarden Twitter-woorden biedt inzicht in de dynamische aard van Amerikaans-Engels en hoe dit in de loop van de tijd evolueert. Nieuwe woorden ontstaan, oude woorden verdwijnen en de betekenis van woorden kan veranderen als gevolg van culturele, sociale en technologische veranderingen. Twitter-gegevens dienen als een waardevolle bron voor het bestuderen van realtime taalverandering, waardoor onderzoekers de taalevolutie tot in ongekend detail kunnen volgen.

Implicaties:

De bevindingen van dit onderzoek hebben implicaties voor verschillende vakgebieden, waaronder historische taalkunde, sociologie en culturele studies. Het begrijpen van de evolutie van het Amerikaans-Engels kan waardevolle informatie opleveren over maatschappelijke veranderingen, culturele trends en de veranderende behoeften van taalgebruikers.