science >> Wetenschap >  >> Elektronica

Een nieuwe benadering voor softwarefoutvoorspelling met behulp van functieselectie

Een schematisch diagram van de voorgestelde methodologie. Krediet:Turabieh, Mafarja &Li.

Onderzoekers aan de Taif-universiteit, Birzeit University en RMIT University hebben een nieuwe benadering ontwikkeld voor softwarefoutvoorspelling (SFP), die enkele van de beperkingen van bestaande SFP-technieken voor machine learning aanpakt. Hun aanpak maakt gebruik van functieselectie (FS) om de prestaties van een gelaagd recurrent neuraal netwerk (L-RNN) te verbeteren, die wordt gebruikt als een classificatietool voor SFP.

Softwarefoutvoorspelling (SFP) is het proces van het voorspellen van modules die gevoelig zijn voor fouten in nieuw ontwikkelde software. Het voorspellen van fouten in softwarecomponenten voordat deze aan de eindgebruiker worden geleverd, is van groot belang, omdat het tijd kan besparen, inspanning en ongemak die gepaard gaan met het identificeren en aanpakken van deze problemen in een later stadium.

In recente jaren, machine learning technieken zoals neurale netwerken, logistische regressie, ondersteuningsvectormachines en ensembleclassifiers zijn zeer effectief gebleken bij het aanpakken van SFP. Echter, vanwege de enorme hoeveelheid gegevens die kan worden verkregen door historische opslagplaatsen voor mijnbouwsoftware, het is mogelijk om kenmerken tegen te komen die geen verband houden met de fouten. Dit kan het leeralgoritme soms misleiden, waardoor de prestaties afnemen.

Functieselectie (FS) is een techniek die kan helpen deze niet-gerelateerde functies te elimineren zonder afbreuk te doen aan de prestaties van het machine learning-algoritme. Bij machinaal leren, kenmerkselectie houdt in dat een subset van relevante kenmerken (d.w.z. voorspellers) wordt geselecteerd om in een bepaald model te worden gebruikt. FS kan de dimensionaliteit van gegevens verminderen; het verwijderen van irrelevante en overbodige gegevens.

In hun krant gepubliceerd in expert systemen met applicaties , het onderzoeksteam van Taif University, Birzeit University en RMIT University hebben een nieuwe FS-benadering voorgesteld om de prestaties van een gelaagd recurrent neuraal netwerk (L-RNN) voor SFP te verbeteren. De onderzoekers gebruikten iteratief drie verschillende wrapper-FS-algoritmen:binair genetisch algoritme (BGA), binaire deeltjeszwermoptimalisatie (BPSO), en binaire mierenkolonie-optimalisatie (BACO).

"We hebben een herhaald kenmerkselectie-algoritme voorgesteld met een gelaagd terugkerend neuraal netwerk voor het oplossen van het voorspellingsprobleem van softwarefouten, " schreven de onderzoekers in hun paper. "Het voorgestelde algoritme is in staat om de belangrijkste softwarestatistieken te selecteren met behulp van verschillende algoritmen voor het selecteren van kenmerken. Het classificatieproces wordt uitgevoerd door een gelaagd terugkerend neuraal netwerk."

De onderzoekers evalueerden hun aanpak op 19 real-world softwareprojecten uit de PROMISE-repository en vergeleken hun resultaten met die verkregen met behulp van andere state-of-the-art benaderingen, waaronder Naïeve Bayes (NB), kunstmatige neurale netwerken (ANN's), logistische regressie (LR), de k-dichtstbijzijnde buren (k-NN) en C4.5-beslisbomen. Hun aanpak presteerde beter dan alle andere bestaande methoden, het bereiken van een gemiddelde classificatiesnelheid van 0,8358 over alle datasets.

"De verkregen resultaten ondersteunen onze bewering dat functieselectie belangrijk is bij het bouwen van een classificatie van hoge kwaliteit in plaats van een vaste set functies of alle functies te gebruiken, " verklaarden de onderzoekers in hun paper. "Voor toekomstig werk, we zijn van plan om de prestaties van verschillende classificaties, zoals genetische programmering, te onderzoeken om een ​​computermodel te bouwen dat fouten kan voorspellen op basis van geselecteerde statistieken."

© 2019 Wetenschap X Netwerk