Review: Umsetzung der Google Search Appliance in einer Intranet-Umgebung
Unsere Firmen-Intranet ist eine Non-gerahmte Umgebung mit Lotus Domino und IIS (. Net und klassischen ASP) Anwendungen und Inhalte. Wir haben zwischen 300,000-500,000 Seiten der Web-Inhalte und Dokumente in mehr als 1200 "Fallen" auf etwa 30 einzigartige Domains. Wir haben zur Inktomi's Ultraseek Server 3.0 als unser Intranet-Suchmaschine, die zu Beginn wie Alter (erworben im Jahr 1998). Das Produkt sei Inktomi Anhänge nicht gut (DOC, PPT, PDF, etc.), würde nicht gecrawlt unserer gesicherten Seiten, und nicht mehr vom Hersteller unterstützt. Wir haben eine oberflächliche Überprüfung der Suche Hersteller und wurden sofort angezogen zu den Google - 30-Tage-Testversion Angebot für ihre Google Search Appliance (GSA). Nach Unterzeichnung eines Standard-Abkommens sind, versandt uns eine völlig neue glänzende gelb-Einheit, die wir testen konnten für 30 Tage vor dem Rückflug oder purchasing.Product infoThe GSA ist eine "Black Box" Standard 1U Rack-Server. Mit "Black Box" Ich meine, Google bietet Ihnen ein Web-Interface zur Verwaltung der Geräte, aber nicht wollen, dass Sie für den Zugriff auf das Betriebssystem (a stark angepasste Google-Version von Linux). In der Tat, die Lizenz-Vereinbarung sieht vor, dass Sie nicht mit der Hardware manipulieren oder OS des Gerätes in keiner Weise. Das Gerät verfügt über keine Notwendigkeit für eine Tastatur, Maus-oder Video - ? alles, was Sie brauchen für den normalen Betrieb ist ein Netzwerk-Kabel und Power input.The GSA gibt es in verschiedenen Geschmacksrichtungen an unterschiedliche Bedürfnisse je nach Größe der Hardware und Größe entsprechend der Lizenz. (Die Lizenzierung erfolgt auf der Grundlage der Anzahl der gecrawlten URLs von der Appliance.) Es gibt 3 verschiedene Hardware-Konfigurationen, die GB-1001, GB-5005 und GB-800. Diese gliedern sich wie folgt auf, GB-1001? 150K für $ 28K, 300K für $ 50K-GB-5005? 1,5 MB für $ 230K GB-8008? 4M für $ 450K Warum Google? Wie bekannt, der GSA erfüllt alle unsere Bedürfnisse zu können Index der Vielzahl von Dateitypen haben wir in unserem Umwelt, den Zugang gesichert Inhalte, die über eine dokumentierte API, etc. Die Google Markenkraft Verkauf war ein weiterer großer Faktor. Wenn wir gesagt, unsere Nutzer, dass sie gingen, um ein Google-basierten Suchmaschine sie wussten ihre Tagen nach der schwierigen Suche waren. Schließlich hat die 30-Tage-Testversion läuft Erfahrung hatten wir mit der GSA versiegelt das Geschäft. Das Gerät ist die einfachste Lösung Unternehmen den ich je hatte zu installieren, zu konfigurieren und zu warten. Wir wurden wörtlich und innerhalb einer Stunde nach Öffnen der Versand box.InstallationThe Gerät verfügt über zwei Netzwerk-Ports auf der Rückseite, eine für den normalen Betrieb und die anderen, die ausschließlich für Netzwerk Konfiguration. So konfigurieren Sie die Netzwerk-Einstellungen wir mit einem Laptop auf das Gerät über eine spezielle (einige Pin-Outs sind Nicht-Standard-) orange Ethernet-Kabel enthalten. Die Installation war so einfach Wie man sich vorstellen, für eine "black box". Zuerst steckt in den normalen Betrieb Netzwerk-Kabel und dann die Macht. Netzstecker aus der Steckdose auf dem Gerät ist der Netzschalter, schließen Sie es, um, und ziehen Sie sie, um Sie sie ab. Nach dem Einstecken in, warteten wir ca. 5 Minuten für das Gerät zu spielen eine Melodie, die das Signal, um fortzufahren. Weiter haben wir den Schritt von unserem Laptop (bereits auf DHCP-Modus) auf dem Gerät und powered es. Nach der Anmeldung in unserem Laptop und machen Sie sicher, wir hatten die richtige IP, die von der Appliance integrierten DHCP-Server in der wir bereit sind, die Konfiguration der Netzwerk-Einstellungen. Insgesamt verstrichene Zeit (ohne Rack): 10 minutes.ConfigurationNetwork Konfiguration, wie normale Verwaltung ist, wird vollständig über einen Browser und ist ein einfaches 5 Schritt Prozess. Die ersten Screens Sie bitten, für die grundlegende Netzwerk-Informationen, die IP-Adresse, Subnet Maske, Standard-Gateway und DNS. Nachfolgende Bildschirmen sammeln SMTP-Server, "Von"-Adresse für die GSA-Benachrichtigungen, Zeitzone, NTP (Zeit) Server und der Admin-Account-Namen und Passwort. Der letzte Schritt ist die Test ein paar URLs, die Sie wird Crawlen, um sicherzustellen, dass Sie das Setup richtig gemacht. Nach einer abschließenden Überprüfung Bildschirm-Einstellungen die Konfiguration abgeschlossen ist, und Sie können dann ziehen Sie Ihren Laptop und zum guten Teil; Crawling. Total Zeit: 10 minutes.Crawling die Website (s) Mit der URL, die gesamte Verwaltung der GSA ist der Ferne erfolgen. Nach der Anmeldung mit der ID / Passwort haben wir in den vorherigen Schritt, waren wir mit der Administration Console. Wir haben eine neue Kollektion zu unserem Index enthalten sind, in die "Start Crawlen" URL, kopieren Sie dieselbe URL in das "Folgen" und "Crawl nur URLs mit der Nach Muster "ein und wir tun. Wir haben unsere Einstellungen und dann auf die Schaltfläche" Start Crawling "-Taste. Wir gingen dann auf die" Crawling-Status "-Bildschirm und sah die" gecrawlte URLs "Zähler erhöhen. Google wirbt, dass sie crawlen rund 4.000 URLs in etwa 15 Minuten oder so. Wir haben festgestellt, die Crawling-Zeit erheblich zunehmen, wenn es Dokumente (Word, PDF, Excel, usw.) in Verbindung die von den URLS.After das Crawling erfolgt die Erhebung wird automatisch indiziert und dann gegen die Serving-Voraussetzungen (alle Kriterien die Sie verwenden möchten, um festzustellen, ob sie einen Index-Sammlung auf Produktion) und die Sammlung wird entweder in der Produktion (und damit durchsuchbar) oder in Staging. Die Staging-Bereich können Sie die neuen Crawlings vor dem Nutzer die Suche gegen them.Crawling configurationAfter Ihre erste Crawling finden Sie die Notwendigkeit, gehen Sie zurück und verändern das Crawlen Parameter. Google gibt Ihnen ein gutes Maß an Kontrolle darüber, wie gecrawlten Seiten sind, die Häufigkeit, wie viele Threads verwendet werden, usw. Für die Plätze mit der Sicherheit, der GSA unterstützt Basic-Authentifizierung und ein zusätzlicher Sicherheits-Modul zur Verfügung, die Formularauthentifizierung. Die größte Herausforderung Konfiguration Aspekte waren für uns die Bestimmung die richtige Kombination von URL-Muster, um von der Suche auszuschließen. Wenn Sie ein Domino-Shop suchen und die Verwendung der GSA müssen Sie möglicherweise einige Zeit um die Crawler Konfiguration genau richtig, um die manchmal wechselhafte Domino Abfragezeichenfolge parameters.After wir das Crawling Parameter eingestellt und die erste vollständige Crawlings getan haben wir getestet, um zu sehen, wenn der Crawler packte alle Inhalte. Durchsuchen Sie unsere Webseite und Tests mit einigen Strings tief in der Taxonomie wir immer die GSA gecrawlten hatte sie genau. Wir haben auch einige Tests mit Strings innerhalb von PDF-Dokumenten, PowerPoint-Präsentationen und dergleichen. Wenn wir haben über etwas, das noch nicht gecrawlt eine sorgfältige Analyse führte uns zu entdecken, dass wir zu tun, etwas mehr Feinabstimmung der Crawling settings.Other bemerkenswerte featuresGoogle auch erhalten Sie ein Werkzeug, das KeyMatch können Sie angeben, welche Dokumente indiziert erscheinen soll an der Spitze der Suchergebnisse für eine bestimmte Suchanfrage. Diese manifestieren sich fast identisch mit den Sponsored Links oben auf der Seite der Ergebnisse Google wir alle. Ein Synonym Tool können Sie alternative Wörter oder Wortgruppen für Suchanfragen. Zum Beispiel, wenn jemand sucht WCM, können Sie empfehlen "Web Content Management" an der Spitze der Ergebnisse page.An Ausgabeformat Funktion können Sie die Kontrolle (über einen XSLT) die Präsentation der Suchergebnisse. Sie können diese für die Änderung der Schriftarten, Farben, Logo, Kopf, usw. von der Ergebnisseite angezeigt werden. Wir waren in der Lage zu leicht zu entfernen, die "Im Cache"-Funktion auf der Ergebnisseite mit einigen XSLT modifications.The Reporting-Tool können Sie Berichte über die Suchanfragen über verschiedene Zeit reicht. Es zeigt Ihnen die Anzahl der Suchvorgänge pro Tag, pro Stunde, die Top-100-Keywords und Top-100-Suchanfragen für den Zeitraum specified.DownsidesThe GSA ist nicht für Organisationen der Suche indiziert werden ihre gemeinsame Netzwerk-Laufwerke, wie das Gerät hat keine Möglichkeit, für Crawling-Dateisysteme. Das ist wirklich so schlecht, wie viele Unternehmen kämpfen mit den riesigen Mengen an unstrukturierten Inhalte auf ihren Netzen. Natürlich gibt es auch eine Vielzahl anderer Produkte, die es für Genau diese issue.Access direkt an Datenbanken (zB SQL, Oracle, etc.) ist ein weiterer Bereich, die off-limits für die GSA sowie jede Art von Integration mit Content-oder Dokumenten-Management-systems.ConclusionThe Google Search Appliance (GSA) ist ein hervorragendes Produkt für die Suche HTTP-Inhalte zugänglich. Es gibt große Kontrolle über die administrativen Funktionen, wie Crawler-Konfiguration und die Ergebnisse dienen und ausreichende Berichterstattung Fähigkeiten als auch. Die Suche nach einer Lösung zu integrieren, direkt mit einem Inhalt / Dokumenten-Management-System, Datenbanken, Netzwerk-Laufwerke oder Indizierung sollte zu einem anderen Produkt. Allerdings, wenn Sie eine Intranet - oder Intranet-Site mit vielen HTML-basierte Inhalte der GSA kann genau das, was Sie need.Bryan Mjaanes ist der Autor / Herausgeber von Intranet101.com, eine Community-basierte Intranet-Forum für Profis.
Artikel Quelle: Messaggiamo.Com
Related:
» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy
Holen Sie sich den HTML-Code fü Webmaster
Fügen Sie diese Artikel Ihrer Website jetzt hinzu!
Webmaster veröffentlichen Sie Ihre Artikel
Keine Anmeldung erforderlich! Füllen Sie das Formular aus und Ihr Artikel wird im Messaggiamo.Com Artikel-Verzeichnis aufgenommen!