Recenze: provádění Google Search Appliance v prostředí intranetu
Naše firemní intranet je non-zarámované prostředí, jak s Lotus Domino a IIS (. Čisté a klasické ASP), aplikací a obsahu. Máme mezi 300,000-500,000 stránkách webového obsahu a dokumentů na více než 1200 "místa" na zhruba 30 unikátních doménách. Mívali jsme Inktomi se UltraSeek Server 3.0 jako našeho intranetu vyhledávač, který byl začíná vypadat jako jeho věku (koupil v roce 1998). Produkt Inktomi se nezpracovává a příloh (DOC, PPT, PDF, atd.), nebude procházet naší zabezpečené stránky, a byl již podporován prodejcem. Udělali jsme zběžný přehled vyhledávání dodavatelů a byly okamžitě přilákal do Google 30 denní zkušební nabídku pro své Google Search Appliance (GSA). Po podpisu standardní smlouvy, jsou odeslány nás zbrusu nový lesklý žlutý jednotka, která bychom mohli zkušební dobu 30 dní, než se vrátí, nebo purchasing.Product infoThe GSA je "černou skříňku" 1U standard rack-mountable server. Od "černé skříňky" Myslím, že Google nabízí webové rozhraní pro správu zařízení, ale nechci, abyste pro přístup k Operating System ( Google-silně upravenou verzi Linuxu). Ve skutečnosti, licenční smlouvy, stanoví, že nebudete manipulovat s hardware nebo OS spotřebiče v žádném případě. Zařízení nepotřebuje klávesnici, myš nebo video ? vše, co potřebujete pro běžný provoz je síťový kabel a standardní napájecí input.The GSA přichází v různých příchutích přizpůsobit různým potřebám různý podle velikosti hardware a odpovídajícím velikosti licence. (Udělení licence na základě počtu adres URL navštívena spotřebiče.) Existují 3 různé hardwarové konfigurace, GB-1001, GB-5005 a GB-800. Tyto jsou rozděleny takto; GB-1001? 150K dokumenty za $ 28K, 300K dokumenty za $ 50K CZ-5005? 1,5 Mb / s dokumenty za $ 230K GB-8008? 4M dokumenty za $ 450K Proč Google? Je inzerován, GSA splněny všechny naše potřeby budou moci indexovat mnoho různých typů souborů máme v naší prostředí, přístup k obsahu zabezpečených s zdokumentované API, atd. značky Google síly byl další velký prodejní faktor. Když jsme řekli našim uživatelům, že se dostanu na Google-vyhledávač věděli, že jejich dnů neklidné hledání skončila. Konečně, 30-ti denní zkušební běh zkušenosti jsme měli s GSA uzavřené dohody. Spotřebič je nejjednodušší podnikové řešení, jaké jsem kdy musel instalovat, konfigurovat a udržovat. My byly doslova a do provozu do jedné hodiny od otevření lodní box.InstallationThe přístroj má dva síťové porty na zadním panelu, jeden pro normální provoz a další používané výhradně pro síť konfiguraci. Chcete-li konfigurovat nastavení sítě jsme se připojili k notebooku přes speciální zařízení (některé pin-out jsou non-standard) oranžové ethernetový kabel, který je součástí dodávky. Instalační proces byl asi tak snadné Lze si snadno představit na "černou skříňku." Nejdříve jsme se zapojit do normálního provozu kabelové sítě a pak moc. Napájecí konektor na zařízení je vypínač, připojte se k zapnutí a odpojte jej otočit ho. Poté, co v připojením, čekali jsme asi 5 minut na zařízení hrát melodii, která je signál, aby pokračovala. Dále jsme napojené na naše notebook (již nastaven na režim DHCP) pro napájení zařízení, a to. Po přihlášení do našeho notebooku a zajištění jsme měli správnou IP přiřazena spotřebič má vestavěný-in DHCP server jsme připraveni konfigurovat nastavení sítě. Celkový uplynulý čas (bez stojanu montáž): 10 minutes.ConfigurationNetwork konfigurace, jako normální podání se provádí výhradně prostřednictvím prohlížeče a je jednoduchý 5 krocích. První obrazovky Vás požádat o základní informace o síti, IP adresy, podsítě masku, výchozí bránu a DNS. Následné obrazovky shromažďují SMTP server, "Z" adresa pro oznamovací zprávy GSA, časové pásmo, NTP (čas), servery a administrátorský účet jméno a heslo. Posledním krokem je test několik adres URL, které budete plazit se ujistili, že jste udělali správné nastavení. Po závěrečné revizi nastavení obrazovky nastavení je kompletní a pak můžete odpojit notebook a dostanete se na správné straně; start plazit. Uplynulý celkový čas: 10 minutes.Crawling místo (a) Pomocí adresy URL, všechny správa GSA se provádí na dálku. Po přihlášení se ID a heslo jsme se v předchozím kroku jsme byli předložen konzoly pro správu. Vytvořili jsme novou kolekci držet našeho indexu, dát do "Start plazení z" URL, kopírování, že stejnou adresu URL do "Pojďte a procházení pouze adresy URL s Následujícího vzorce "pole a jsme skončili. Zachránili jsme naše nastavení, a pak kliknete na" Start plazení "tlačítko. Potom jsme přešli na" status Crawl "obrazovkou a sledoval" Crawled URL "proti zvýšení. Inzeruje, že Google může procházet kolem 4000 URL asi za 15 minut nebo tak nějak. Našli jsme procházení době by se významně zvýšily, pokud existují dokumenty (Word, PDF, Excel atd.) související se od těch URLS.After procházení probíhá sbírka je automaticky indexovány a poté porovnány Doručování Předpoklady (nějaká kritéria, který chcete použít, zda se má přesunout do indexované kolekce produkce) a sběr bude buď přesunuty do produkce (a tedy možností vyhledávání), nebo být přesunuty do zastávky. Oblast Představovat vám umožní prověřit nové prochází před umožňuje uživatelům vyhledávat proti them.Crawling configurationAfter první procházení můžete zjistit, že je třeba se vrátit a doladit procházení parametrů. Google vám dá dobrou množství kontrolu nad tím, jak se plazil místa, kolik frekvence, vlákna se používají, atd. Pro místa s jistotou, GSA podporuje základní ověřování a další bezpečnostní modul je k dispozici formuláře, které podporuje ověřování. Z nejnáročnějších aspektů konfigurace pro nás bylo stanovení správnou kombinaci vzorů URL vyloučit z vyhledávání. Pokud jste prodejna Domino a chtějí využít GSA budete muset strávit nějaký čas dostat pásový konfiguraci pouze právo na podporu někdy spletité Domino otazníkem parameters.After máme procházení naladěné parametry a první kompletní procházení jsme se udělat nějaké testy, aby zjistili, zda prohledávač chytil všechny obsah. Prohlížení našich stránek a testování s některými struny ukryté hluboko uvnitř taxonomie vždy našli GSA se plazil ně přesně. Také jsme udělali pár zkoušek s řetězci uvnitř dokumentů ve formátu PDF, PowerPoint prezentace a podobně. Když jsme přišel na něco, které nebyly plazil pečlivá analýza nás přivedla k zjistili, že potřebujeme udělat nějaké další vylepšování této procházení settings.Other pozoruhodné featuresGoogle také nabízí nástroj, který KeyMatch umožňuje určit, které indexované dokumenty by měly být uvedeny v horní části stránky s výsledky pro daný dotaz. Ty se projevují téměř totožné s Sponzorované odkazy v horní části stránky s výsledky v Google jsme všichni používají. Synonymum nástroj umožňuje definovat alternativní slova nebo fráze na vyhledávacích dotazů. Například, pokud někdo hledá WCM, můžete navrhnout "Web Content Management" v horní části Výsledky page.An výstupní formát funkce umožňuje ovládání (pomocí XSLT) prezentace výsledků vyhledávání. Můžete použít pro změnu písma, barvy, logo, záhlaví atd. stránky s výsledky hledání. Byli jsme schopni snadno odstranit "Cached" vyskytovat na stránce s výsledky s některými XSLT modifications.The nástroj Reporting umožňuje spustit zpráv o dotazech v průběhu různých časových pásmech. To vám ukáže počet vyhledávání za den, za hodinu, prvních 100 klíčových slov a prvních 100 dotazů za specified.DownsidesThe období GSA není pro organizace, které hledají do indexu jejich sdílené síťové disky, protože přístroj nemá zařízení pro plazí souborové systémy. To je opravdu škoda, protože mnoho společnosti potýkají s obrovským množstvím nestrukturovaného obsahu na ukládány do jejich sítí. Samozřejmě, existuje nepřeberné množství dalších produktů, které pro přesně toto issue.Access přímo do databáze (např. SQL, Oracle, atd.) je další oblast, která je off-limity pro GSA, stejně jako jakékoli integraci s obsahem nebo dokument management systems.ConclusionThe Google Search Appliance (GSA), je vynikající produkt pro vyhledávání HTTP-přístupný obsah. To dává velkou kontrolu nad správní funkce, jako jsou pásové konfigurace a výsledky slouží a dostatečné zpráv schopnosti. Ty, kteří hledají řešení integrovat přímo s obsahem / systému správy dokumentů, databází, nebo disky indexování sítě by měla zaměřit na jiný produkt. Nicméně, pokud máte intranetu nebo intranetu s dostatkem HTML-na obsah GSA může být právě to, co need.Bryan Mjaanes je tvůrcem / editor Intranet101.com, komunita-založené fórum pro profesionály intranetu.
Článek Zdroj: Messaggiamo.Com
Related:
» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy
Webmaster si html kód
Přidejte tento článek do svých webových stránek se!
Webmaster Zašlete svůj článek
Ne nutná registrace! Vyplňte formulář a váš článek je v Messaggiamo.Com Adresář!