Ubuntu

Komma igång med Rstudio på Ubuntu Linux

Komma igång med Rstudio på Ubuntu Linux
Denna handledning kommer att illustrera hur du installerar Rstudio på Ubuntu 20.04.

Rstudio tillhandahåller en integrerad utvecklingsmiljö för att hantera gratis programmeringsspråk ”R” grejer, som är tillgängligt under licens från GNU. Rstudio är en idealisk datormiljö för att generera detaljerade statistiska visualiseringar och används som sådan av statistiker över hela världen.

RStudio råkar också vara tillgängligt som ett program och som en serverapplikation, som används av en mängd olika Linux-distributioner och för Windows och macOS.

Ladda ner R programmeringsspråk (Förutsättningar)

Rstudio-skrivbordsprogrammet behöver programmeringsspråket R för att fungera på Linux-distributioner. Det är nödvändigt att ladda ner en R-version som är kompatibel med ditt Linux-operativsystem. Du kan ladda ner den med ett programvarulager.

1 - Ladda ner R med webbläsaren

Om du inte kan få R från programvarucentret betyder det att förvaret måste uppdateras först. Du kan bara hoppa över allt detta och ladda ner det från webben genom att skriva in den här länken:

https: // kran.studio.com

I sökrutan i din webbläsare. Deras hemsida ska likna skärmdumpen nedan:

2- Ladda ner R från Linux-terminalen

Slå upp CLI-terminalen, skriv in kommandot nedan och tryck enter:

Kör sedan en uppdatering med kommandona nedan:

$ sudo apt-get-uppdatering

Detta kommando hämtar R: s uppdateringar och förvärvar alla relevanta filer från huvudförvaret för Ubuntu.

Ge sedan följande kommando för att installera R:

Kommandot ovan går igenom paketlistan, avslöjar hur mycket diskutrymme det kommer att fyllas och ber sedan om bekräftelse. Tryck på Y-tangenten på tangentbordet för att fortsätta med installationen.

Utgången kommer sannolikt att bekräfta installationen.

Du kan slå upp den i sökrutan enligt bilden nedan:

Installerar Rstudio på Ubuntu 20.04 med kommandoterminal

Med värdprogrammeringsspråket installerat kan vi nu fortsätta att installera Rstudio. För att demonstrera installationen använder vi kommandoradsterminalen.

Avfyra terminalen och utfärda följande

$ sudo apt-get install gdebi-core

Du uppmanas att ange rotlösenordet. När du har angett lösenordet påbörjas paketinstallationen

$ wget https: // nedladdning1.rstudio.org / desktop / bionic / amd64 / rstudio-1.3.1093-amd64.deb

Rstudio online-paketet har nu anslutits och överförs till din hårddisk.

Du ombeds att ange rotlösenordet igen. Ange lösenordet så att paketlistan läses och laddas.

Den installerade kommer att be om tillstånd att fortsätta, tryck på y-tangenten på tangentbordet.

Utdata kommer att verifiera installationen, som visas nedan.

Komma igång med RStudio:

För att starta RStudio, gå över till sökrutan och leta upp Rstudio. Du ser det i en av listorna som visas nedan:

Klicka på Rstudio-ikonen för att starta den.

Undersöker datamängder med RStudio

Med Rstudio kan du visualisera alla data i form av grafer, tabeller och diagram.

För att förstå hur data representeras visuellt i Rstudio, låt oss ta exemplet på folkräkning 2010 för varje postnummer som ett exempel.

Processen för dataanalys kan vagt reduceras till följande fyra steg:

1-Importera rådata

Du kan importera rådata direkt från webben till Rstudio genom att göra det systematiskt i konsolfönstret med kommandot nedan:

$ cpd <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")

När kommandot körs kommer Rstudio att hämta data som en csv-fil från webben, och innehållet tilldelas cpd-variabeln.

Ett annat sätt att gå till med att importera data till Rstudio är att manuellt ladda ner datasetet till din hårddisk och sedan öppna innehållet med Rstudios importdatafunktion.

Gå till alternativet Importera dataset på fliken Miljö och välj den datasetfil som ska laddas upp. Klicka på Ok så visas dialogrutan om datasetet. Det är här du ska specificera parametrarna, samt namn och decimaler. När du är klar klickar du bara på import och datasetet läggs till i Rstudio och en variabel tilldelas dess namn.

För att se vilka datamängder som används, utfärda kommandot nedan med variabeln som tillskrivs en dataset:

$ Visa (cpd)

2 -manipulera data

Nu när du har importerat datauppsättningen finns det mycket du kan göra för att omvandla dessa data. Uppgifterna manipuleras genom transformationsfunktioner. Antag att du vill turnera till en viss matris inom datamängden. Om vi ​​skulle gå till den totala befolkningskolumnen i vår dataset, skulle vi ange kommandot nedan:

$ cpd $ Total befolkning

Uppgifterna kan också hämtas i form av en vektor:

$ cpd [1,3]

Delmängdsfunktionen i Rstudio tillåter oss att fråga datauppsättningen. Låt oss säga att vi måste markera raderna där förhållandet mellan man och kvinna är positivt. För att välja ut dessa rader, skulle du utfärda följande kommando:

$ a <- subset(cpd , Total Males > Totalt antal kvinnor)

I kommandot ovan måste den första parametern vi tilldelades vara variabeln som tillskrivs datamängden som vi tillämpade funktionen på. Booleskt tillstånd anses vara den andra parametern. Dessutom måste det booleska tillståndet bedömas för varje rad. Det fungerar som avgörande för huruvida en rad ska vara en del av utdata.

3 -Använda de genomsnittliga funktionerna i datasetet

Rstudio har specifika funktioner för att räkna ut medelvärden i datasetet:

$ medelvärde (cpd $ Totalt antal män) - beräknar enkelt genomsnitt
$ median (cpd $ Total Females) - ger medianen för en kolumn
$ quantile (cpd $ Total Population) - ger kvantilen för en kolumn
$ var (cpd $ Totalt antal män) - utarbetar variansen för en kolumn
$ sd (cpd $ Totalt kvinnor) - ger standardavvikelse

För att få den sammanfattade rapporten om datamängden kan du också köra någon av dessa funktioner i hela datamängden.

$ sammanfattning (cpd)

4-Skapa ett diagram för datasetet

Om du ofta kommer att arbeta med Rstudio hittar du dess visualiseringsverktyg mycket resursstarkt. Du kan skapa en graf ur alla importerade dataset med plot och andra visualiseringsfunktioner i Rstudio.

För att generera en scatterplot för datasetet, skulle du utfärda följande kommando:

$ plot (x = s $ Totalt antal män, y = s $ Totalt kvinnor, typ = 'p')

Låt oss nu diskutera de parametrar som är inblandade här. I varje parameter hänvisar s till delmängden av den ursprungliga datamängden, och genom att lägga till "p" anger du att du vill att utdata ska plottas.

Du kan också representera din dataset i form av ett histogram:

$ hist (cpd $ Totalt antal hushåll)

På samma sätt kan du få ett stapeldiagram över den importerade datasetet:

$ räknas <- table(cpd$Total Population)
$ barplot (counts, main = "Total befolkningsfördelning",
$ xlab = "Antal Totalbefolkningar")

Hantera data i ojämnt fördelade tidsserier

För att hantera data med ojämnt fördelade tidsserier bör du integrera djurparkpaketet med Rstudio. För att få zoo-paketet, gå till det nedre högra hörnet på skärmen i Rstudio och till paketets komponent. Zoo-paketet omvandlar oregelbundna tidsseriedata till djurobjekt. Argumenten införda för att skapa zooobjekt är data som kommer först, följt av värdet att beställa efter.

Zooobjekt ger stöd för enkel användning. Allt du behöver göra är att skriva "plot", så visas alla plotmetoder du kan använda med det djurparkpaketet.

Om du befinner dig förvirrad över vad en viss Rstudio-funktion har att erbjuda, ange den funktionens namn och följ det med “?”För att se uppmaningen på hjälpmenyn. Att trycka på ctrl + mellanslag efter ett funktionsnamn ger också automatiskt kompletteringsfönster.

Avslutar

Denna handledning har illustrerat hur du kan ställa in Rstudio på Ubuntu 20.04 och behandlade grunderna för statistisk representation och manipulation med Rstudio. Om du vill använda Rstudio bättre, bör du bekanta dig med R-programmeringsgrunderna ett bra första steg. Rstudio är ett kraftfullt verktyg och har applikationer i många branscher över hela världen: artificiell intelligens och data mining, för att nämna några.

Att lära känna R-programmeringens nitty-gritty är lite av en inlärningskurva, men det är värt ansträngningen.

Hur man utvecklar ett spel på Linux
För ett decennium sedan skulle inte många Linux-användare förutsäga att deras favoritoperativsystem en dag skulle vara en populär spelplattform för ko...
Portar med öppen källkod för kommersiella spelmotorer
Gratis, öppen källkod och plattformsmekaniska rekreationer kan användas för att spela gamla såväl som några av de ganska senaste speltitlarna. I den h...
Bästa kommandoradsspel för Linux
Kommandoraden är inte bara din största allierade när du använder Linux, det kan också vara källan till underhållning eftersom du kan använda den för a...