I den här artikeln ska jag visa dig hur du får den aktuella webbadressen till webbläsaren med Selen. Så, låt oss komma igång.
Förutsättningar:
För att prova kommandon och exempel på den här artikeln måste du ha,
1) En Linux-distribution (helst Ubuntu) installerad på din dator.
2) Python 3 installerad på din dator.
3) PIP 3 installerad på din dator.
4) Python virtualenv paketet installerat på din dator.
5) Mozilla Firefox eller Google Chrome webbläsare installerade på din dator.
6) Måste veta hur man installerar Firefox Gecko Driver eller Chrome Web Driver.
Läs min artikel för att uppfylla kraven 4, 5 och 6 Introduktion till Selen med Python 3 på Linuxhint.com.
Du kan hitta många artiklar om de andra ämnena på LinuxHint.com. Var noga med att kolla in dem om du behöver hjälp.
Ställa in en projektkatalog:
Skapa en ny projektkatalog för att hålla allt ordnat selen-url / som följer:
$ mkdir -pv selen-url / drivrutiner
Navigera till selen-url / projektkatalog enligt följande:
$ cd selen-url /
Skapa en virtuell Python-miljö i projektkatalogen enligt följande:
$ virtualenv .venv
Aktivera den virtuella miljön enligt följande:
$ källa .venv / bin / aktivera
Installera Selenium Python-biblioteket i din virtuella miljö med PIP3 enligt följande:
$ pip3 installera selen
Ladda ner och installera alla nödvändiga webbdrivrutiner i förare / projektkatalogen. Jag har förklarat processen för nedladdning och installation av webbdrivrutiner i min artikel Introduktion till Selen med Python 3. Om du behöver hjälp, sök vidare LinuxHint.com för den artikeln.
Jag kommer att använda webbläsaren Google Chrome för demonstrationen i den här artikeln. Så jag kommer att använda kromförare binär med Selen. Du bör använda geckodriver binär om du vill använda webbläsaren Firefox.
Få aktuell webbadress med selen:
Skapa ett Python-skript ex01.py i din projektkatalog och skriv in följande rader med koder i den.
från selenimportwebdriverfrån selen.webbdrivare.allmänning.nycklar importerar nycklar
alternativ = webdriver.ChromeOptions ()
alternativ.headless = Sant
webbläsare = webdriver.Chrome (executable_path = "./ drivers / chromedriver ", optioner = optioner)
webbläsare.get ("https: // duckduckgo.com / ")
skriv ut (webbläsare.nuvarande_url)
webbläsare.stänga()
När du är klar sparar du ex01.py Python-skript.
Här importerar rad 1 och rad 2 alla nödvändiga komponenter från Python-selenbiblioteket.
Linje 4 skapar ett Chrome-alternativobjekt och rad 5 möjliggör headless-läge för Chrome-webbläsaren.
Linje 7 skapar en Chrome webbläsare objekt med hjälp av kromförare binär från förare / projektkatalogen.
Linje 9 ber webbläsaren att ladda duckduckgo.com webbplats.
Rad 10 skriver ut webbläsarens aktuella URL. Här, webbläsare.nuvarande_url egendom används för att komma åt webbläsarens aktuella URL.
Rad 12 stänger webbläsaren.
Kör Python-skriptet ex01.py som följer:
$ python3 ex01.py
Som du kan se är den aktuella webbadressen (https: // duckduckgo.com) skrivs ut på konsolen.
I det tidigare exemplet har jag besökt webbplatsen duckduckgo.com och skrev ut den aktuella URL: n på konsolen. Detta returnerar webbadressen till den sida vi besöker. Inte särskilt snyggt eftersom vi redan känner till sidans URL. Låt oss nu söka efter något på DuckDuckGo och försöka skriva ut webbadressen till sökresultatsidan på konsolen.
Skapa ett Python-skript ex02.py i din projektkatalog och skriv in följande rader med koder i den.
från selenimportwebdriverfrån selen.webbdrivare.allmänning.nycklar importerar nycklar
alternativ = webdriver.ChromeOptions ()
alternativ.headless = Sant
webbläsare = webdriver.Chrome (executable_path = "./ drivers / chromedriver ", optioner = optioner)
webbläsare.get ("https: // duckduckgo.com / ")
skriv ut (webbläsare.nuvarande_url)
searchInput = webbläsare.find_element_by_id ('search_form_input_homepage')
searchInput.send_keys ('selen hq' + nycklar.STIGA PÅ)
skriv ut (webbläsare.nuvarande_url)
webbläsare.stänga()
När du är klar sparar du ex02.py Python-skript.
Här är raderna 1-10 desamma som i ex01.py. Så jag förklarar inte dem igen.
Rad 12 hittar söktextrutan och lagrar den i searchInput variabel.
Rad 13 skickar sökfrågan selen hq i searchInput textruta och trycker på
När söksidan laddas, webbläsare.nuvarande_url används för att komma åt den uppdaterade aktuella webbadressen.
Rad 15 skriver ut den uppdaterade aktuella webbadressen på konsolen.
Rad 17 stänger webbläsaren.
Springa det ex02.py Python-skript enligt följande:
$ python3 ex02.py
Som du kan se, Python-skriptet ex02.py skriver ut 2 webbadresser.
Den första är webbadressen till DuckDuckGo-sökmotorn.
Den andra är den uppdaterade aktuella webbadressen efter sökning på DuckDuckGo-sökmotorn med hjälp av frågan selen hq.
Slutsats:
I den här artikeln har jag visat dig hur du hämtar den aktuella webbadressen till webbläsaren med Selenium Python-biblioteket. Nu borde du kunna göra dina Selen-projekt mer intressanta.