Review: la mise en œuvre du système Google Search Appliance dans un environnement intranet
Notre intranet est un non-cadres à la fois l'environnement Lotus Domino et IIS (. Net et ASP) d'applications et de contenus. Nous avons entre 300,000-500,000 pages de contenu web et de documents dans plus de 1200 "sites" sur environ 30 unique domaines. Nous avons déjà eu l'Inktomi Ultraseek Server 3.0 comme notre moteur de recherche intranet qui commence à ressembler à son âge (acheté en 1998). Le produit n'a Inktomi pas bien traiter les pièces jointes (DOC, PPT, PDF, etc), ne serait pas de notre exploration des sites sécurisés, et n'est plus pris en charge par le vendeur. Nous avons fait un examen sommaire de la recherche des fournisseurs et ont été immédiatement attiré par Google 30 jours d'essai pour leur système Google Search Appliance (GSA). Après la signature d'un accord, ils nous expédier un nouveau brillant jaune unité que nous avons pu le tester pendant 30 jours avant de retourner ou purchasing.Product infoThe GSA est une "boîte noire" standard 1U montable en rack serveur. Par "boîte noire" Je veux dire, Google vous offre une interface web pour administrer le dispositif, mais ne veulent pas d'accéder aux systèmes d'exploitation (a fortement Google version personnalisée de Linux). En fait, le contrat de licence stipule que vous ne pourrez pas altérer le matériel ou l'OS de l'appareil en aucune manière. Le dispositif n'a pas besoin d'un clavier, une souris ou de la vidéo ? tous ce dont vous avez besoin pour le fonctionnement normal est un câble réseau standard et de pouvoir input.The GSA existe en plusieurs saveurs pour s'adapter à différents besoins variant selon la taille de l'équipement et donc la taille de la licence. (Octroi de licences est basé sur le nombre d'URL explorés par le système.) Il existe 3 configurations matérielles différentes, le GB-1001, GB-5005, et GB-800. Elles sont ventilées comme suit: GB-1001? 150 documents pour $ 28K, 300K pour $ 50K documents GB-5005? 1,5 M $ 230K pour les documents GB-8008? 4M $ 450k documents Pourquoi Google? Comme annoncé, l'Association a rencontré l'ensemble de nos besoins d'être en mesure d'indexer la grande variété de types de fichiers que nous avons dans nos l'environnement, l'accès garanti de contenu, d'une API documentée, etc La marque Google est une autre grande puissance a été facteur de vente. Lorsque nous avons dit à nos utilisateurs qu'ils allaient obtenir un Google-moteur de recherche, ils savaient que leur jours de la recherche ont plus de difficulté. Enfin, le 30-jours d'essai d'expérience que nous avons eu avec la GSA a scellé le deal. L'appareil est la solution d'entreprise plus facile que j'aie jamais eu à installer, à configurer et à entretenir. Nous ont été littéralement place dans l'heure de l'ouverture de l'expédition box.InstallationThe l'appareil dispose de deux ports sur le panneau arrière, l'une pour le fonctionnement normal et l'autre utilisé exclusivement pour le réseau configuration. Pour configurer les paramètres de réseau, nous avons branché un ordinateur portable à l'appareil par l'intermédiaire d'un (une pin-outs sont non-standard) câble Ethernet orange qui est inclus. Le processus d'installation est à peu près aussi facile comme on peut l'imaginer pour une «boîte noire». Nous avons d'abord branché le fonctionnement normal du réseau de câble et la puissance. La fiche d'alimentation sur l'appareil est le bouton d'alimentation, branchez-le à son tour et débranchez-le à son tour it off. Après le brancher en, nous avons attendu environ 5 minutes pour l'appareil de jouer une musique qui est le signal pour continuer. Ensuite, nous avons branché notre ordinateur portable (déjà mis à la mode DHCP) à l'appareil et il powered up. Une fois connecté à notre ordinateur portable et s'assurer que nous avons eu la bonne IP attribuée par l'appareil intégré dans le serveur DHCP, nous sommes prêts à configurer les paramètres réseau. Total du temps écoulé (à l'exclusion de montage en rack): 10 minutes.ConfigurationNetwork configuration, comme l'administration normale, se fait entièrement via un navigateur et est un processus simple en 5 étapes. Le premier écran vous demande de base du réseau d'information; l'adresse IP, sous-réseau masque, la passerelle par défaut et DNS. Les écrans de recueillir serveur SMTP, "De" l'adresse des messages de notification pour les GSA, le fuseau horaire, NTP (heure), les serveurs et le nom du compte admin / mot de passe. La dernière étape consiste à tester quelques URL qui vous sera d'exploration de vous assurer que vous avez fait l'installation correctement. Après un dernier examen des paramètres d'écran de configuration est terminée et vous pouvez alors débrancher votre ordinateur portable et accéder à la bonne partie; commencer l'exploration. Total temps écoulé: 10 minutes.Crawling le site (s) Utilisation de l'URL fournie, l'administration de la GSA se fait à distance. Après vous être connecté avec l'identifiant / mot de passe, nous avons fourni à l'étape précédente, nous avons été avec la console d'administration. Nous avons créé une nouvelle collection de tenir notre index, mettre dans le "Démarrer l'exploration de l'URL, copier cette même URL dans la" Suivre et explorer les URL avec le Après modes »et nous avons fait. Nous avons sauvé nos paramètres, puis cliquez sur" Start exploration bouton. Nous avons ensuite allé à l'exploration du statut "d'écran et j'ai vu la" Exploré URL de la "contre augmenter. Google annonce qu'il peut explorer à propos de 4000 URL dans environ 15 minutes. Nous avons trouvé le temps d'exploration augmentent sensiblement, si il ya des documents (Word, PDF, Excel, etc) liés à partir de ces URLS.After l'exploration est en fait la collection est indexée automatiquement, puis vérifiés au regard des conditions préalables de service (tous les critères que vous souhaitez utiliser afin de déterminer s'il faut déplacer une collection indexée à production) et de la collecte sera soit transféré à la production (et donc la recherche) ou être déplacé à la mise en scène. La zone vous permet de valider de nouvelles explorations avant de laisser les utilisateurs de recherche contre them.Crawling configurationAfter votre première exploration, vous trouverez mai la nécessité de revenir en arrière et modifier les paramètres de l'exploration. Google vous donne une bonne dose de contrôle sur la manière dont les sites sont explorés, la fréquence, combien de fils sont utilisés, etc Pour les sites de la sécurité, l'Association prend en charge l'authentification de base et un module de sécurité est disponible qui prend en charge l'authentification par formulaire. La configuration des aspects les plus difficiles pour nous, ont été la détermination de la bonne combinaison de formats d'URL à exclure de la recherche. Si vous êtes un magasin Domino et cherchent à utiliser la GSA, vous mai besoin de passer quelques temps à l'exploration de la configuration juste pour soutenir la parfois alambiquée Domino query string parameters.After nous avons réglé les paramètres de l'exploration et de la première exploration nous avons fait quelques tests pour voir si le robot a saisi tout le contenu. La navigation sur notre site et des essais avec quelques chaînes enfouies à l'intérieur de la taxonomie nous avons toujours trouvé la GSA a exploré avec précision. Nous avons également fait quelques tests avec les chaînes de caractères dans les documents PDF, présentations PowerPoint, etc. Lorsque nous n'a trouver quelque chose qui n'a pas été explorée d'une analyse minutieuse nous a conduit à découvrir que nous avions besoin de faire d'autres ajustements de l'exploration settings.Other notable featuresGoogle vous donne également un outil de correspondance vous permet de spécifier quels documents indexés doit apparaître en haut de la page de résultats pour une requête. Ces manifestent presque identique aux Liens commerciaux en haut de la page de résultats de la Google nous utilisons tous. Synonyme Un outil vous permet de spécifier d'autres mots ou expressions pour les requêtes de recherche. Par exemple, si quelqu'un cherche WCM, vous pouvez suggérer "Web Content Management" en haut de la résultats page.An format de sortie vous permet de contrôler (par le biais d'un XSLT) de la présentation des résultats de recherche. Vous pouvez l'utiliser pour changer les polices, les couleurs, logo, tête, etc de la page de résultats. Nous avons été en mesure de facilement enlever le «cache» sur la page de résultats avec quelques XSLT modifications.The Reporting outil vous permet de créer des rapports sur les requêtes de recherche sur différentes gammes de temps. Il vous indiquera le nombre de recherches par jour, par heure, les 100 mots clés et les 100 requêtes pour la période specified.DownsidesThe GSA n'est pas pour les organisations qui cherchent à leur indice de lecteurs réseau que l'appareil n'a pas de facilité pour l'exploration des systèmes de fichiers. C'est vraiment dommage que de nombreuses entreprises, avec les énormes quantités de contenus non structurés sur stockées sur leurs réseaux. Bien sûr, il existe une multitude d'autres produits là-bas pour exactement ce issue.Access directement aux bases de données (par exemple, SQL, Oracle, etc) est un autre domaine qui est hors-limites pour les GSA, ainsi que tout type de contenu ou de l'intégration avec la gestion des documents systems.ConclusionThe Google Search Appliance (GSA) est un excellent produit de recherche pour HTTP accessible contenu. Il donne une grande maîtrise de fonctions administratives telles que les chenilles et les résultats au service de configuration et suffisante de rapports capacités ainsi. Ceux qui cherchent une solution pour intégrer directement à un contenu / système de gestion de documents, bases de données, d'indexation ou les lecteurs réseau devrait ressembler à un autre produit. Toutefois, si vous disposez d'un intranet ou site intranet et abondamment avec de l'HTML basé sur le contenu de la GSA mai être tout ce que vous need.Bryan Mjaanes est le créateur / éditeur de Intranet101.com, une communauté fondée sur Intranet forum pour les professionnels.
Source D'Article: Messaggiamo.Com
Related:
» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy
Webmaster obtenir le code html
Ajouter cet article sur votre site Web dès maintenant!
Webmaster envoyer vos articles
Aucune inscription requise! Remplissez le formulaire et votre article est dans le Messaggiamo.Com répertoire!