Topp 20 bästa R maskininlärningspaket att kolla in nu

Nästan alla nybörjade dataforskare och maskininlärningsutvecklare är förvirrade över att välja ett programmeringsspråk. De frågar alltid vilket programmeringsspråk som passar bäst för deras maskininlärning och datavetenskapsprojekt. Antingen går vi för python, R eller MatLab. Valet av ett programmeringsspråk beror på utvecklarnas preferenser och systemkrav. Bland andra programmeringsspråk är R ett av de mest potentiella och fantastiska programmeringsspråken som har flera R-maskininlärningspaket för både ML-, AI- och datavetenskapsprojekt.

Som en konsekvens kan man utveckla sitt projekt enkelt och effektivt genom att använda dessa R maskininlärningspaket. Enligt en undersökning av Kaggle är R ett av de mest populära språkinlärningsspråken för öppen källkod.

Bästa R maskininlärningspaket

R är ett öppen källkodsspråk så att människor kan bidra var som helst i världen. Du kan använda en svart ruta i din kod, som skrivs av någon annan. I R kallas denna Black Box för ett paket. Paketet är inget annat än en förskriven kod som kan användas upprepade gånger av vem som helst. Nedan visar vi de 20 bästa R-maskininlärningspaketen.

1. MARKÖR

Paketet CARET hänvisar till klassificering och regressionsträning. Uppgiften med detta CARET-paket är att integrera utbildning och förutsägelse av en modell. Det är ett av de bästa R-paketen för maskininlärning samt datavetenskap.

Parametrarna kan sökas genom att integrera flera funktioner för att beräkna den totala prestandan för en viss modell med hjälp av rutans sökmetod i detta paket. Efter att alla prövningar har slutförts lyckas nätverkssökningen äntligen hitta de bästa kombinationerna.

Efter installationen av detta paket kan utvecklaren köra namn (getModelInfo ()) för att se de 217 möjliga funktionerna som bara kan köras genom en funktion. För att bygga en förutsägbar modell använder CARET-paketet en tågfunktion (). Syntaxen för denna funktion:

träna (formel, data, metod)

Dokumentation

2. randomForest

RandomForest är ett av de mest populära R-paketen för maskininlärning. Detta R-maskininlärningspaket kan användas för att lösa regressions- och klassificeringsuppgifter. Dessutom kan den användas för att träna saknade värden och outliers.

Detta maskininlärningspaket med R används vanligtvis för att generera flera antal beslutsträd. I grund och botten tar det slumpmässiga prover. Och sedan ges observationer i beslutsträdet. Slutligen är den gemensamma produktionen som kommer från beslutsträdet den ultimata produktionen. Syntaxen för denna funktion:

randomForest (formel =, data =)

Dokumentation

3. e1071

Denna e1071 är ett av de mest använda R-paketen för maskininlärning. Med hjälp av det här paketet kan en utvecklare implementera supportvektormaskiner (SVM), kortaste beräkning av vägar, påsekluster, Naive Bayes-klassificerare, korttids Fourier-transformation, otydligt kluster etc.

Som exempel är SVM-syntax för IRIS-data:

svm (Art ~ Sepal.Längd + Sepal.Bredd, data = iris)

Dokumentation

4. Rpart

Rpart står för rekursiv träning av partitionering och regression. Detta R-paket för maskininlärning kan utföras båda uppgifterna: klassificering och regression. Det fungerar med ett tvåstegssteg. Outputmodellen är ett binärt träd. Funktionen plot () används för att plotta utgångsresultatet. Det finns också en alternativ funktion, prp () -funktion, som är mer flexibel och kraftfull än en grundläggande plot () -funktion.

Funktionen rpart () används för att skapa en relation mellan oberoende och beroende variabler. Syntaksen är:

rpart (formel, data =, metod =, kontroll =)

där formeln är kombinationen av oberoende och beroende variabler, data är namnet på datasetet, metoden är målet och kontroll är ditt systemkrav.

Dokumentation

5. KernLab

Om du vill utveckla ditt projekt baserat på kärnbaserade maskininlärningsalgoritmer kan du använda detta R-paket för maskininlärning. Detta paket används för SVM, kärnfunktionsanalys, rankningsalgoritm, primitiv för produktprodukt, Gaussisk process och många fler. KernLab används ofta för SVM-implementeringar.

Det finns olika kärnfunktioner tillgängliga. Vissa kärnfunktioner nämns här: polydot (polynomiell kärnfunktion), tanhdot (hyperbolisk tangentkärnfunktion), laplacedot (laplacian kernel function), etc. Dessa funktioner används för att utföra problem med mönsterigenkänning. Men användare kan använda sina kärnfunktioner istället för fördefinierade kärnfunktioner.

Dokumentation

6. nnet

Om du vill utveckla din maskininlärningsapplikation med hjälp av det artificiella neurala nätverket (ANN) kan detta nnet-paket hjälpa dig. Det är en av de mest populära och enkla att implementera ett paket med neurala nätverk. Men det är en begränsning det är att det är ett enda lager av noder.

Syntaxen för detta paket är:

nnet (formel, data, storlek)

Dokumentation

7. dplyr

Ett av de mest använda R-paketen för datavetenskap. Det ger också några lättanvända, snabba och konsekventa funktioner för datamanipulation. Hadley Wickham skriver detta r programmeringspaket för datavetenskap. Detta paket består av en uppsättning verb i.e., mutera (), välj (), filtrera (), sammanfatta () och ordna ().

För att installera detta paket måste man skriva den här koden:

Installera.paket (“dplyr”)

Och för att ladda detta paket måste du skriva denna syntax:

bibliotek (dplyr)

Dokumentation

8. ggplot2

En annan av de mest eleganta och estetiska grafikramarna R-paket för datavetenskap är ggplot2. Det är ett system för att skapa grafik baserat på grafikens grammatik. Installationssyntaxen för detta datavetenskapspaket är:

Installera.paket (“ggplot2”)

Dokumentation

9. Wordcloud

När en enskild bild består av tusentals ord kallas den Wordcloud. I grund och botten är det en visualisering av textdata. Detta maskininlärningspaket som använder R används för att skapa en representation av ord, och utvecklaren kan anpassa Wordcloud enligt hans önskemål, som att ordna orden slumpmässigt eller samma frekvensord tillsammans eller högfrekventa ord i mitten, etc.

I R-maskininlärningsspråket finns två bibliotek tillgängliga för att skapa wordcloud: Wordcloud och Worldcloud2. Här visar vi syntaxen för WordCloud2. För att installera WordCloud2 måste du skriva:

1. kräver (devtools)
2. install_github (“lchiffon / wordcloud2”)

Eller så kan du använda den direkt:

bibliotek (wordcloud2)

Dokumentation

10. tidyr

Ett annat allmänt använt r-paket för datavetenskap är tidyr. Målet med denna programmering för datavetenskap är att städa data. I tidy placeras variabeln i kolumnen, observation placeras i raden och värdet finns i cellen. Detta paket beskriver ett standardiserat sätt att sortera data.

För installation kan du använda det här kodfragmentet:

Installera.paket (“tidyr”)

För laddning är koden:

bibliotek (tidyr)

Dokumentation

11. skinande

R-paketet, Shiny, är en av ramarna för webbapplikationer för datavetenskap. Det hjälper till att bygga upp webbapplikationer från R utan ansträngning. Antingen kan utvecklaren installera programvaran på varje klientsystem eller hyra en webbsida. Dessutom kan utvecklaren bygga instrumentpaneler eller kan bädda in dem i R Markdown-dokument.

Dessutom kan blanka appar utökas med olika skriptspråk som html-widgets, CSS-teman och JavaScript-åtgärder. Med ett ord kan vi säga att detta paket är en kombination av R-beräkningskraften och interaktiviteten hos det moderna nätet.

Dokumentation

12. tm

Naturligtvis är textbrytning en framväxande tillämpning av maskininlärning nuförtiden. Detta R-maskininlärningspaket ger en ram för att lösa textbrytningsuppgifter. I en applikation för textbrytning, jag.e., sentimentanalys eller nyhetsklassificering, en utvecklare har olika typer av tråkigt arbete som att ta bort oönskade och irrelevanta ord, ta bort skiljetecken, ta bort stoppord och många fler.

Tm-paketet innehåller flera flexibla funktioner som gör ditt arbete enkelt som removeNumbers (): för att ta bort siffror från det givna textdokumentet, weightTfIdf (): för term Frekvens och invers dokumentfrekvens, tm_reduce (): för att kombinera transformationer, removePunctuation () till ta bort skiljetecken från det givna textdokumentet och många fler.

Dokumentation

13. MÖSS-paket

Maskininlärningspaketet med R, MICE hänvisar till Multivariate Imputation via Chained Sequences. Nästan hela tiden står projektutvecklaren inför ett vanligt problem med maskininlärningsdatasetet som saknar värdet. Detta paket kan användas för att tillskriva de saknade värdena med flera tekniker.

Detta paket innehåller flera funktioner som inspektion av saknade datamönster, diagnos av imputerade värden, analys av färdiga datamängder, lagring och export av imputerad data i olika format och många fler.

Dokumentation

14. igraph

Nätverksanalyspaketet, igraph, är ett av de kraftfulla R-paketen för datavetenskap. Det är en samling kraftfulla, effektiva, enkla att använda och bärbara nätverksanalysverktyg. Detta paket är också öppen källkod och gratis. Dessutom kan igraphn programmeras på Python, C / C ++ och Mathematica.

Detta paket har flera funktioner för att generera slumpmässiga och regelbundna grafer, visualisering av en graf, etc. Du kan också arbeta med din stora graf med hjälp av detta R-paket. Det finns vissa krav för att använda detta paket: för Linux krävs en C och en C ++ - kompilator.

Installationen av detta R-programmeringspaket för datavetenskap är:

Installera.paket (“igraph”)

För att ladda detta paket måste du skriva:

bibliotek (igraph)

Dokumentation

15. ROCR

R-paketet för datavetenskap, ROCR, används för att visualisera prestandan för poängklassificerare. Detta paket är flexibelt och enkelt att använda. Endast tre kommandon och standardvärden för valfria parametrar behövs. Detta paket används för att utveckla cutoff-parametrerade 2D-prestandakurvor. I det här paketet finns det flera funktioner som prediction (), som används för att skapa prediktionsobjekt, performance () som används för att skapa performance-objekt, etc.

Dokumentation

16. DataExplorer

Paketet DataExplorer är ett av de mest omfattande lättanvända R-paketen för datavetenskap. Bland de många datavetenskapliga uppgifterna är utforskande dataanalys (EDA) en av dem. I undersökande dataanalys måste dataanalytikern ägna mer uppmärksamhet åt data. Det är inte ett enkelt jobb att kolla in eller hantera data manuellt eller använda dålig kodning. Automatisering av dataanalys behövs.

Detta R-paket för datavetenskap ger automatisering av datautforskning. Detta paket används för att skanna och analysera varje variabel och visualisera dem. Det är användbart när datamängden är massiv. Så, dataanalysen kan extrahera den dolda kunskapen om data effektivt och enkelt.

Paketet kan installeras från CRAN direkt med hjälp av nedanstående kod:

Installera.paket (“DataExplorer”)

För att ladda detta R-paket måste du skriva:

bibliotek (DataExplorer)

Dokumentation

17. mlr

Ett av de mest otroliga paketen för R maskininlärning är mlr-paketet. Detta paket är kryptering av flera maskininlärningsuppgifter. Det betyder att du kan utföra flera uppgifter genom att bara använda ett enda paket, och du behöver inte använda tre paket för tre olika uppgifter.

Paketet mlr är ett gränssnitt för många klassificerings- och regressionstekniker. Teknikerna inkluderar maskinläsbara parameterbeskrivningar, klustring, generisk omprovtagning, filtrering, funktionsextraktion och många fler. Parallella operationer kan också göras.

För installation måste du använda följande kod:

Installera.paket (“mlr”)

Så här laddar du paketet:

bibliotek (mlr)

Dokumentation

18. arules

Paketet, arules (Mining association rules and Frequent Itemsets), är ett omfattande R-maskininlärningspaket. Genom att använda detta paket kan flera operationer göras. Verksamheten är representations- och transaktionsanalys av data och mönster och datamanipulation. C-implementering av Apriori och Eclat-gruvalgoritmer finns också.

Dokumentation

19. mboost

Ett annat R-maskininlärningspaket för datavetenskap är mboost. Detta modellbaserade boosting-paket har en funktionell gradientnedstigningsalgoritm för att optimera allmänna riskfunktioner genom att använda regressionsträd eller komponentmässiga uppskattningar av minsta kvadrater. Det ger också en interaktionsmodell för potentiellt högdimensionell data.

Dokumentation

20. fest

Ett annat paket i maskininlärning med R är fest. Denna beräkningsverktygslåda används för rekursiv partitionering. Huvudfunktionen eller kärnan i detta maskininlärningspaket är ctree (). Det är en mycket använd funktion som minskar träningstiden och förspänningen.

Syntaxen för ctree () är:

ctree (formel, data)

Dokumentation

Avslutande tankar

R är ett så framträdande programmeringsspråk som använder statistiska metoder och grafer för att utforska data. Det behöver inte sägas att detta språk har flera antal R-maskininlärningspaket, ett otroligt RStudio-verktyg och lättförståelig syntax för att utveckla avancerade maskininlärningsprojekt. I ett R ml-paket finns det några standardvärden. Innan du applicerar det på ditt program måste du ha kunskap om de olika alternativen i detalj. Genom att använda dessa maskininlärningspaket kan vem som helst bygga en effektiv maskininlärnings- eller datavetenskapsmodell. Slutligen är R ett språk med öppen källkod och dess paket växer ständigt.

Om du har några förslag eller frågor, vänligen lämna en kommentar i vårt kommentarsektion. Du kan också dela den här artikeln med dina vänner och familj via sociala medier.