Apache Solr

Bästa självvärd sökmotorer

Bästa självvärd sökmotorer
Vet din chef att du letar efter ett annat jobb? Har du berättat för din betydande annan om oförmågan att bestämma om du vill ha barn eller inte? Känner ni föräldrar om er sexuella läggning? Tja, Google och andra stora sökmotorer gör det.

"De flesta användare söker på Google när de är inloggade, så all information om deras onlineliv är tillgänglig: YouTube-sökningar, e-postmeddelanden och tidigare sökhistorik", säger Adam Tauber, den ledande utvecklaren av sekretess-respekterande metasökningsmotor Searx.

Naturligtvis kan du använda Tor för anonymitet och alltid ta bort alla spår av din aktivitet efter varje sökning, men att göra det efter varje sökning skulle sannolikt bli gammalt ganska snabbt. Istället bör du överväga att installera en egenvärdad sökmotor som kan hämta information åt dig utan att avslöja något känsligt om dig.

Vi har valt två sådana sökmotorer, och vi introducerar också ytterligare tre sökmotorer för att visa dig att utmärkta alternativ till egna sökmotorer som Google eller Bing redan finns och är lättare att installera och använda än du kanske tror.

1. YaCy

YaCy är en gratis distribuerad peer-to-peer-sökmotor vars kärnkomponent är skriven i Java. Eftersom alla YaCy-användare är lika och eftersom sökmotorn inte lagrar användarsökningsförfrågningar är det helt enkelt inte möjligt att censurera.

För närvarande indexerar YaCy cirka 1.4 miljarder dokument i indexet tack vare aktiviteten hos mer än 600 peer-operatörer som bidrar till det varje månad. Som jämförelse innehåller Googles sökindex hundratals miljarder webbsidor och är över 100 000 000 gigabyte.

Medan YaCy fortfarande har en lång väg kvar innan den kan konkurrera med de största centraliserade sökmotorerna i världen, är den redan användbar som en sökportal för privata intranät och projektspecifika applikationer eftersom YaCy kan fungera som en enda sökverktyg utan nätverk med andra kamrater.

YaCy kan enkelt integreras i vilken webbsida som helst tack vare sina enkla kodavsnitt som enkelt kan kopieras och klistras in utan ändringar.

2. Searx

Searx beskrivs som en integritetsrelaterad, hackbar metasökningsmotor. Den är tillgänglig under GNU Affero General Public License version 3, och dess huvudsakliga mål är att skydda användarnas integritet genom att aldrig dela användarnas IP-adresser eller sökhistorik med de sökmotorer som de samlar resultat från.

"När du använder Searx skickas IP-adressen till Searx, en slumpmässig User-Agent och en sökfråga till Google som standard", förklarar Adam Tauber, aka asciimoo, hur hans metasökmotor fungerar. ”Naturligtvis kan du anpassa Searx för att vidarebefordra andra extra parametrar som sökspråk eller sidnumret på den begärda resultatsidan.”

Searx blockerar automatiskt alla spårningskakor som serveras av sökmotorerna för att förhindra användarprofileringsbaserad resultatändring, vilket kan bero på att en sökmotor försöker implementera sökning som är individualiserad baserat på vad motorn vet om användaren. Searx är 100 procent gratis och vem som helst kan ändra det efter behov. Du kan till och med ta Searx-koden och köra metasökningsmotorn på din egen server, vilket definitivt borde ta itu med eventuella problem du har om loggar.

3. ElasticSearch

ElasticSearch är en sökmotor baserad på Lucene, ett gratis bibliotek med öppen källkod för informationshämtning som stöds av Apache Software Foundation och släpps under Apache Software License.

ElasticSearch erbjuder en sökmotor i fulltext med ett HTTP-webbgränssnitt. Sökmotorn kan användas för att söka i alla typer av dokument, och den kan enkelt distribueras över flera noder.

Det är möjligt att bygga en självvärd sökmotor med ElasticSearch och Docker, och du kan hitta en handledning som beskriver processen här.

4. Ambar

Ambar är en sökmotor med öppen källkod med många användbara funktioner. Den stöder automatiserad genomsökning, märkning och omedelbar fulltextsökning, bara för att ge några exempel. En av de mest spännande funktionerna i Ambar är dess förmåga att utföra OCR på bilder och PDF-filer. De språk som stöds inkluderar engelska, tyska, ryska, italienska, franska, spanska, polska och nederländska.

Ambar kan enkelt distribueras med en enda docker-komponeringsfil, och du kan lära dig hur man gör det här.

5. Apache Solr

Apache Solr är skriven i Java och är en sökplattform för företag som inkluderar fulltext-sökning, träffmarkering, facetterad sökning, realtidsindexering, dynamiskt kluster och många andra viktiga funktioner. Det skapades 2004 för ett internt projekt på CNET Networks. CNET Networks donerade det vänligt till Apache Software Foundation 2006, där det tog examen från inkubationsstatus till ett fristående toppnivåprojekt 2007.

Idag är Solr en mycket tillförlitlig, skalbar och feletolerant företagssökplattform som driver sök- och navigeringsfunktioner på många av världens största webbplatser, inklusive DuckDuckGo, eHarmony och BestBuy. Du kan

Hur man installerar och konfigurerar YaCy

Installationen av YaCy är väldigt enkel och det tar bara några minuter eftersom du inte behöver installera en extern databas eller webbserver - YaCy levereras med allt som behövs.

  1. Gå till den officiella webbplatsen för YaCy och ladda ner det senaste paketet för Linux.
  2. Installera OpenJDK 8-körningsmiljön.
    • Om du använder en Debian-baserad distribution använder du följande kommando: $ sudo apt-get install openjdk-8-jre
    • Om inte, följ instruktionerna som är specifika för din distribution.
  3. Extrahera det nedladdade paketet till önskad plats.
  4. Gå till den nya mappen och starta “startYACY.sh ”-skript i Terminal.
  5. Du bör se ett bekräftelsemeddelande som informerar dig om att YaCy startade som en demon

Slutsats

Sökmotorer vet mer om oss än de flesta skulle vilja erkänna. Om du vill sluta mata stora företag med saftig data kan du ta saker i dina egna händer och skapa en egen värdmotor för att skydda din integritet. Även om sökmotorer med egen värd fortfarande har en lång väg att gå för att bli fullt användbara, är potentialen för dem att överträffa Google som det finns och att fånga det är bara en fråga om att locka fler användare.

Hur man visar FPS-räknare i Linux-spel
Linux-spel fick ett stort tryck när Valve tillkännagav Linux-stöd för Steam-klient och deras spel 2012. Sedan dess har många AAA- och indiespel tagit ...
Hur man laddar ner och spelar Sid Meier's Civilization VI på Linux
Introduktion till spelet Civilization 6 är ett modernt intag av det klassiska konceptet som introducerades i serien Age of Empires-spel. Idén var gans...
Hur man installerar och spelar Doom på Linux
Introduktion till Doom Doom-serien har sitt ursprung på 90-talet efter att den ursprungliga Doom släpptes. Det blev en omedelbar hit och från den tide...