Datavetenskap

Python Plotly Tutorial

Python Plotly Tutorial
Plotly är ett analysföretag känt för att utveckla realtidsanalys-, statistik- och diagramverktyg för webbaserad applikation och fristående Python-skript. I den här lektionen kommer vi att titta på grundläggande exempel med Plotly och bygga upp enkla och intuitiva tidsseriedatagrafier som kommer att vara 100% interaktiva till sin natur och ändå enkla att utforma. Dessa grafer kan användas i presentationer eftersom de är helt interaktiva och redo att leka med.

Det finns också ett alternativ att spara en grafdesign offline så att de enkelt kan exporteras. Det finns många andra funktioner som gör det enkelt att använda biblioteket:

För att börja använda Plotly-paketet måste vi registrera oss för ett konto på den tidigare nämnda webbplatsen för att få ett giltigt användarnamn och API-nyckel med vilket vi kan börja använda dess funktioner. Lyckligtvis finns en gratis prissättningsplan tillgänglig för Plotly som vi får tillräckligt med funktioner för att göra produktionsgradskartor.

Installera Plotly

Bara en anteckning innan du börjar kan du använda en virtuell miljö för den här lektionen som vi kan göra med följande kommando:

python -m virtualenv plottligt
källa numpy / bin / aktivera

När den virtuella miljön är aktiv kan du installera Plotly-biblioteket i det virtuella env så att exempel vi skapar nästa kan köras:

pip installera plott

Vi kommer att använda Anaconda och Jupyter i den här lektionen. Om du vill installera den på din maskin, titta på lektionen som beskriver ”Hur man installerar Anaconda Python på Ubuntu 18.04 LTS ”och dela din feedback om du står inför några problem. För att installera Plotly med Anaconda, använd följande kommando i terminalen från Anaconda:

conda install -c plotly plotly

Vi ser något liknande när vi utför ovanstående kommando:

När alla paket som behövs är installerade och klara kan vi komma igång med att använda Plotly-biblioteket med följande importuttalande:

importera plott

När du har gjort ett konto på Plotly behöver du två saker - användarnamnet på kontot och en API-nyckel. Det kan bara finnas en API-nyckel som tillhör varje konto. Så håll det säkert någonstans som om du tappar det, du måste regenerera nyckeln och alla gamla applikationer som använder den gamla nyckeln slutar fungera.

I alla Python-program som du skriver, nämna referenserna enligt följande för att börja arbeta med Plotly:

intrig.verktyg.set_credentials_file (användarnamn = 'användarnamn', api_key = 'din-api-nyckel')

Låt oss komma igång med det här biblioteket nu.

Komma igång med Plotly

Vi kommer att använda följande import i vårt program:

importera pandor som pd
importera numpy som np
importera scipy som sp
importera plott.intrig som py

Vi använder oss av:

För några av exemplen kommer vi att använda Plotlys egna datauppsättningar tillgängliga på Github. Slutligen, observera att du kan aktivera offline-läge för Plotly också när du behöver köra Plotly-skript utan nätverksanslutning:

importera pandor som pd
importera numpy som np
importera scipy som sp
importera plott
intrig.off-line.init_notebook_mode (ansluten = True)
importera plott.offline som py

Du kan köra följande uttalande för att testa Plotly-installationen:

skriva ut.__version__)

Vi ser något liknande när vi utför ovanstående kommando:

Vi kommer äntligen att ladda ner datasetet med Pandas och visualisera det som en tabell:

importera plott.figur_fabrik som ff
df = pd.read_csv ("https: // raw.githubusercontent.com / plotly / datasets / master / school_
förtjänst.csv ")
tabell = ff.skapa_tabell (df)
py.iplot (tabell, filnamn = 'tabell')

Vi ser något liknande när vi utför ovanstående kommando:

Låt oss konstruera en Stapeldiagram för att visualisera data:

importera plott.graph_objs as go
data = [gå.Bar (x = df.Skola, y = df.Kvinnor)]
py.iplot (data, filnamn = 'kvinnor-bar')

Vi ser något så här när vi kör ovanstående kodavsnitt:

När du ser diagrammet ovan med Jupyter-anteckningsboken kommer du att presenteras med olika alternativ för att zooma in / ut över ett visst avsnitt i diagrammet, Box & Lasso select och mycket mer.

Grupperade stapeldiagram

Flera stapeldiagram kan grupperas tillsammans för jämförelseändamål mycket enkelt med Plotly. Låt oss använda samma dataset för detta och visa variation av män och kvinnor närvaro vid universitet:

kvinnor = gå.Bar (x = df.Skola, y = df.Kvinnor)
män = gå.Bar (x = df.Skola, y = df.Män)
data = [män, kvinnor]
layout = gå.Layout (barmode = "grupp")
fig = gå.Figur (data = data, layout = layout)
py.iplot (fig)

Vi ser något så här när vi kör ovanstående kodavsnitt:

Även om detta ser bra ut är etiketterna i det övre högra hörnet inte korrekt! Låt oss korrigera dem:

kvinnor = gå.Bar (x = df.Skola, y = df.Kvinnor, namn = "Kvinnor")
män = gå.Bar (x = df.Skola, y = df.Män, namn = "Män")

Grafen ser mycket mer beskrivande ut nu:

Låt oss försöka ändra barmod:

layout = gå.Layout (barmode = "relativ")
fig = gå.Figur (data = data, layout = layout)
py.iplot (fig)

Vi ser något så här när vi kör ovanstående kodavsnitt:

Pajdiagram med Plotly

Nu ska vi försöka konstruera ett cirkeldiagram med Plotly som fastställer en grundläggande skillnad mellan andelen kvinnor över alla universitet. Universitetets namn kommer att vara etiketter och de faktiska siffrorna kommer att användas för att beräkna procentandelen av helheten. Här är kodavsnittet för samma:

spåra = gå.Paj (etiketter = df.Skola, värden = df.Kvinnor)
py.iplot ([trace], filnamn = 'pie')

Vi ser något så här när vi kör ovanstående kodavsnitt:

Det bra är att Plotly har många funktioner för att zooma in och ut och många andra verktyg för att interagera med det konstruerade diagrammet.

Tidserie-datavisualisering med Plotly

Visualisering av tidsseriedata är en av de viktigaste uppgifterna när du är dataanalytiker eller dataingenjör.

I det här exemplet kommer vi att använda en separat dataset i samma GitHub-arkiv eftersom tidigare data inte involverade någon tidsstämplad data specifikt. Som här kommer vi att plotta variation av Apples marknadsandel över tiden:

ekonomisk = pd.read_csv ("https: // raw.githubusercontent.com / plotly / dataset / master /
finans-diagram-äpple.csv ")
data = [gå.Scatter (x = ekonomisk.Datum, y = ekonomiskt ['AAPL.Stänga'])]
py.iplot (data)

Vi ser något så här när vi kör ovanstående kodavsnitt:

När du väl håller muspekaren över grafvariationslinjen kan du specificera punktinformation:

Vi kan använda in- och utknappar för att se data som är specifika för varje vecka.

OHLC-diagram

Ett OHLC-diagram (Open High Low close) används för att visa variationer för en enhet över en tidsperiod. Detta är lätt att konstruera med PyPlot:

från datetime importera datetime
open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
höga data = [33.1, 36.3, 33.6, 33.2, 34.8]
low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
datum = [datetime (år = 2013, månad = 10, dag = 10),
datetime (år = 2013, månad = 11, dag = 10),
datetime (år = 2013, månad = 12, dag = 10),
datetime (år = 2014, månad = 1, dag = 10),
datetime (år = 2014, månad = 2, dag = 10)]
spåra = gå.Ohlc (x = datum,
open = open_data,
hög = hög_data,
låg = låg_data,
stäng = stäng_data)
data = [spår]
py.iplot (data)

Här har vi tillhandahållit några exempel på datapunkter som kan härledas enligt följande:

Låt oss nu köra kodavsnittet vi tillhandahöll ovan. Vi ser något så här när vi kör ovanstående kodavsnitt:

Detta är en utmärkt jämförelse av hur man fastställer tidsjämförelser för en enhet med sin egen och jämför den med dess höga och låga prestationer.

Slutsats

I den här lektionen tittade vi på ett annat visualiseringsbibliotek, Plotly som är ett utmärkt alternativ till Matplotlib i applikationer av produktionskvalitet som exponeras som webbapplikationer, Plotly är ett mycket dynamiskt och funktionsrikt bibliotek att använda för produktionsändamål, så detta är definitivt en färdighet vi måste ha under vårt bälte.

Hitta all källkod som används i den här lektionen på Github. Dela din feedback om lektionen på Twitter med @sbmaggarwal och @LinuxHint.

Portar med öppen källkod för kommersiella spelmotorer
Gratis, öppen källkod och plattformsmekaniska rekreationer kan användas för att spela gamla såväl som några av de ganska senaste speltitlarna. I den h...
Bästa kommandoradsspel för Linux
Kommandoraden är inte bara din största allierade när du använder Linux, det kan också vara källan till underhållning eftersom du kan använda den för a...
Bästa Gamepad Mapping Apps för Linux
Om du gillar att spela spel på Linux med en gamepad istället för ett typiskt tangentbord och musinmatningssystem, finns det några användbara appar för...