Selen

Så här får du den aktuella webbadressen med selen

Så här får du den aktuella webbadressen med selen
Selen är ett verktyg för webbläsartestning, webbautomation och webbskrapning. När du arbetar med dina Selen-projekt kan du behöva veta URL-adressen till den sida som din Selen-kontrollerade webbläsare visar. Denna information kan vara användbar för att hålla reda på webbadressen från vilken du har extraherat en del data så att du kanske kan uppdatera data automatiskt med hjälp av något skript.

I den här artikeln ska jag visa dig hur du får den aktuella webbadressen till webbläsaren med Selen. Så, låt oss komma igång.

Förutsättningar:

För att prova kommandon och exempel på den här artikeln måste du ha,

1) En Linux-distribution (helst Ubuntu) installerad på din dator.
2) Python 3 installerad på din dator.
3) PIP 3 installerad på din dator.
4) Python virtualenv paketet installerat på din dator.
5) Mozilla Firefox eller Google Chrome webbläsare installerade på din dator.
6) Måste veta hur man installerar Firefox Gecko Driver eller Chrome Web Driver.

Läs min artikel för att uppfylla kraven 4, 5 och 6 Introduktion till Selen med Python 3 på Linuxhint.com.

Du kan hitta många artiklar om de andra ämnena på LinuxHint.com. Var noga med att kolla in dem om du behöver hjälp.

Ställa in en projektkatalog:

Skapa en ny projektkatalog för att hålla allt ordnat selen-url / som följer:

$ mkdir -pv selen-url / drivrutiner

Navigera till selen-url / projektkatalog enligt följande:

$ cd selen-url /

Skapa en virtuell Python-miljö i projektkatalogen enligt följande:

$ virtualenv .venv

Aktivera den virtuella miljön enligt följande:

$ källa .venv / bin / aktivera

Installera Selenium Python-biblioteket i din virtuella miljö med PIP3 enligt följande:

$ pip3 installera selen

Ladda ner och installera alla nödvändiga webbdrivrutiner i förare / projektkatalogen. Jag har förklarat processen för nedladdning och installation av webbdrivrutiner i min artikel Introduktion till Selen med Python 3. Om du behöver hjälp, sök vidare LinuxHint.com för den artikeln.

Jag kommer att använda webbläsaren Google Chrome för demonstrationen i den här artikeln. Så jag kommer att använda kromförare binär med Selen. Du bör använda geckodriver binär om du vill använda webbläsaren Firefox.

Få aktuell webbadress med selen:

Skapa ett Python-skript ex01.py i din projektkatalog och skriv in följande rader med koder i den.

från selenimportwebdriver
från selen.webbdrivare.allmänning.nycklar importerar nycklar
alternativ = webdriver.ChromeOptions ()
alternativ.headless = Sant
webbläsare = webdriver.Chrome (executable_path = "./ drivers / chromedriver ", optioner = optioner)
webbläsare.get ("https: // duckduckgo.com / ")
skriv ut (webbläsare.nuvarande_url)
webbläsare.stänga()

När du är klar sparar du ex01.py Python-skript.

Här importerar rad 1 och rad 2 alla nödvändiga komponenter från Python-selenbiblioteket.

Linje 4 skapar ett Chrome-alternativobjekt och rad 5 möjliggör headless-läge för Chrome-webbläsaren.

Linje 7 skapar en Chrome webbläsare objekt med hjälp av kromförare binär från förare / projektkatalogen.

Linje 9 ber webbläsaren att ladda duckduckgo.com webbplats.

Rad 10 skriver ut webbläsarens aktuella URL. Här, webbläsare.nuvarande_url egendom används för att komma åt webbläsarens aktuella URL.

Rad 12 stänger webbläsaren.

Kör Python-skriptet ex01.py som följer:

$ python3 ex01.py

Som du kan se är den aktuella webbadressen (https: // duckduckgo.com) skrivs ut på konsolen.

I det tidigare exemplet har jag besökt webbplatsen duckduckgo.com och skrev ut den aktuella URL: n på konsolen. Detta returnerar webbadressen till den sida vi besöker. Inte särskilt snyggt eftersom vi redan känner till sidans URL. Låt oss nu söka efter något på DuckDuckGo och försöka skriva ut webbadressen till sökresultatsidan på konsolen.

Skapa ett Python-skript ex02.py i din projektkatalog och skriv in följande rader med koder i den.

från selenimportwebdriver
från selen.webbdrivare.allmänning.nycklar importerar nycklar
alternativ = webdriver.ChromeOptions ()
alternativ.headless = Sant
webbläsare = webdriver.Chrome (executable_path = "./ drivers / chromedriver ", optioner = optioner)
webbläsare.get ("https: // duckduckgo.com / ")
skriv ut (webbläsare.nuvarande_url)
searchInput = webbläsare.find_element_by_id ('search_form_input_homepage')
searchInput.send_keys ('selen hq' + nycklar.STIGA PÅ)
skriv ut (webbläsare.nuvarande_url)
webbläsare.stänga()

När du är klar sparar du ex02.py Python-skript.

Här är raderna 1-10 desamma som i ex01.py. Så jag förklarar inte dem igen.

Rad 12 hittar söktextrutan och lagrar den i searchInput variabel.

Rad 13 skickar sökfrågan selen hq i searchInput textruta och trycker på med hjälp av Nycklar.STIGA PÅ.

När söksidan laddas, webbläsare.nuvarande_url används för att komma åt den uppdaterade aktuella webbadressen.

Rad 15 skriver ut den uppdaterade aktuella webbadressen på konsolen.

Rad 17 stänger webbläsaren.

Springa det ex02.py Python-skript enligt följande:

$ python3 ex02.py

Som du kan se, Python-skriptet ex02.py skriver ut 2 webbadresser.

Den första är webbadressen till DuckDuckGo-sökmotorn.

Den andra är den uppdaterade aktuella webbadressen efter sökning på DuckDuckGo-sökmotorn med hjälp av frågan selen hq.

Slutsats:

I den här artikeln har jag visat dig hur du hämtar den aktuella webbadressen till webbläsaren med Selenium Python-biblioteket. Nu borde du kunna göra dina Selen-projekt mer intressanta.

Mus Microsoft Sculpt Touch Wireless Mouse Review
Microsoft Sculpt Touch Wireless Mouse Review
Jag har nyligen läst om Microsoft Sculpt Touch trådlös mus och bestämde mig för att köpa den. Efter att ha använt den ett tag bestämde jag mig för att...
Mus AppyMouse styrplatta och muspekare för Windows-surfplattor
AppyMouse styrplatta och muspekare för Windows-surfplattor
Surfplattanvändare saknar ofta muspekaren, särskilt när de brukar använda bärbara datorer. Pekskärmen Smartphones och surfplattor har många fördelar o...
Mus Mellan musknappen fungerar inte i Windows 10
Mellan musknappen fungerar inte i Windows 10
De mittknappen hjälper dig att bläddra igenom långa webbsidor och skärmar med mycket data. Om det slutar, kommer du sluta använda tangentbordet för at...