Review: implementação do Google Search Appliance em um ambiente de intranet
Nossa intranet corporativa é um ambiente non-moldado com ambos os Lotus Domino e IIS (. Net e classic ASP) aplicações e conteúdos. Temos entre 300,000-500,000 páginas de conteúdo web e documentos em mais de 1200 "sites" em cerca de 30 domínios únicos. Costumávamos ter UltraSeek Inktomi Server 3.0 como o nosso motor de pesquisa da intranet, que estava começando a olhar como sua idade (comprado em 1998). O produto não Inktomi não tratar bem os anexos (DOC, PPT, PDF, etc), não seria rastrear nossos sites seguros, e já não era suportado pelo vendedor. Nós fizemos uma análise superficial dos vendedores de pesquisa e foram imediatamente atraídos para Google 30 dias para julgamento oferecer seu Google Search Appliance (GSA). Após assinar um contrato-tipo, que enviaram-nos uma marca nova unidade brilhante amarelo que nós poderíamos testar por 30 dias antes de retornar ou purchasing.Product GSA InformaçãoEmpresa é uma "caixa preta" 1U rack padrão rack-server. Por "caixa preta" Quero dizer, o Google dá-lhe uma interface web para administrar o dispositivo, mas não querem que você acesse o sistema operacional (um pesadamente Google versão customizada do Linux). Na verdade, o contrato de licença especifica que você não vai mexer com o hardware ou sistema operacional do aparelho, de qualquer maneira. O dispositivo não tem necessidade de um teclado, mouse ou vídeo ? Tudo que você precisa para um funcionamento normal é um cabo de rede e de poder de input.The GSA vem em sabores diferentes para se adequar às diferentes necessidades variando pelo tamanho do hardware e do correspondente tamanho da licença. (Licenciamento é baseado no número de URLs rastreadas pelo aparelho.) Existem 3 diferentes configurações de hardware, o GB-1001, PT-5005, e GB-800. Estes são repartidos da seguinte forma; GB-1001? 150K documentos por US $ 28K, 300K documentos por US $ 50K GB-5005? 1.5M documentos por US $ 230 mil GB-8008? 4M documentos por US $ 450K Por que o Google? Como anunciado, o GSA satisfeitas todas as nossas necessidades sendo capaz de índice para a grande variedade de tipos de arquivos que temos em nosso ambiente conteúdo de acesso garantido, tendo uma API documentada, etc O poder da marca Google foi outro fator de grande venda. Quando dissemos a nossos usuários que eles estavam indo para obter um Google-motor de busca baseado eles sabiam que sua dias de busca foram mais incomodados. Por último, o 30-dia período de experiência experiência que tivemos com o GSA fechou o negócio. O aparelho é a solução mais fácil empresa que eu já tinha para instalar, configurar e manter. Nós foram literalmente instalado e funcionando dentro de uma hora de abrir o aparelho box.InstallationThe marítimas tem duas portas de rede no painel traseiro, para um funcionamento normal e os outros utilizados exclusivamente para a rede configuração. Para configurar as configurações de rede que um laptop conectado ao aparelho através de um especial (alguns pin-outs são não-padrão) cabo Ethernet laranja que está incluído. O processo de instalação foi tão fácil como se pode imaginar para uma "caixa preta". Primeiro vamos conectar o cabo normal funcionamento da rede e, em seguida o poder. A tomada de energia do aparelho é o interruptor de alimentação; ligá-lo para ligar e desligá-lo para transformar lo. Depois de ligá-lo, esperamos cerca de 5 minutos para o aparelho para tocar uma música que é o sinal para continuar. Em seguida, nós ligados nosso laptop (já definido para o modo DHCP) para o aparelho e ligado-lo. Após fazer login no nosso computador portátil e ter certeza que nós tivemos o IP correto atribuído pelo aparelho's built-in servidor DHCP estamos prontos para definir as configurações de rede. Tempo decorrido total (sem montagem em rack): 10 configuração minutes.ConfigurationNetwork, como administração normal, é feito inteiramente através de um navegador e é um processo simples de 5 etapas. As telas de primeiro pedir-lhe informações sobre a rede básica; o endereço IP, subnet máscara, gateway padrão e DNS. As telas subseqüentes recolher servidor SMTP, endereço "From" para mensagens de notificação GSA, fuso horário NTP time () servidores eo nome da conta admin / password. O último passo é a testar algumas URLs que você estará rastejando para se certificar de que você fez a configuração corretamente. Depois de um final de configuração da tela de revisão completa e então você pode desligar o seu laptop e começar a parte boa; começar a engatinhar. Tempo decorrido total: 10 minutes.Crawling o site (s) com o URL fornecido, toda a administração do GSA é feito remotamente. Após o login com o ID e senha, desde que na etapa anterior, fomos apresentado com o console de administração. Criamos uma nova coleção para manter nosso índice, coloque no "Iniciar rastreamento de" URL, copiado o mesmo URL para a "seguir e rastrear URLs apenas com o Seguindo os padrões "caixa e fomos feito. Salvamos nossas configurações e, em seguida, clicar em" Iniciar rastreamento "botão. Em seguida, passou para o status do rastreamento" de tela e assisti o Rastreado " URLs contador aumentar. "Google anuncia que pode rastrear cerca de 4.000 URLs em cerca de 15 minutos ou assim. Encontrámos o tempo de rastreamento aumentaria significativamente se houver (documentos do Word, PDF, Excel, etc) ligados a daqueles URLS.After o rastreamento é feito a coleção é indexada automaticamente e em seguida, confrontados com os pré-requisitos de servir (os critérios que deseja usar para determinar se deve mover uma coleção indexada produção) ea cobrança será ou movido à produção (e, consequentemente, pesquisável) ou ser transferido para a classificação. A área de teste permite-lhe validar novos rastreamentos antes de deixar os usuários pesquisarem contra them.Crawling configurationAfter seu primeiro rastrear você pode encontrar a necessidade de voltar atrás e ajustar os parâmetros de rastreamento. Google dá-lhe uma boa quantidade de controle sobre como os sites são rastreados, a freqüência, como muitos tópicos são usados, etc Para sites com segurança, a GSA suporta autenticação básica e um módulo de segurança adicional está disponível que suporta autenticação de formulários. Os aspectos de configuração mais desafiadora para nós, foram determinantes a combinação certa de padrões de URL para excluir da busca. Se você é uma loja Domino e olhando para usar o GSA você pode precisar de gastar algum tempo para a configuração do rastreador apenas direito a apoiar a às vezes complicado Domino parameters.After cadeia de consulta temos os parâmetros ajustados e rastrear o primeiro completo rastreamento feito nós fizemos alguns testes para ver se o rastreador pegou todo o conteúdo. Navegando em nosso site e testes com algumas cordas enterrado profundamente dentro da taxonomia que sempre encontrou o GSA tinha rastreado com precisão. Também fiz alguns testes com as cordas dentro de documentos PDF, apresentações PowerPoint e similares. Quando nós veio através de algo que não tinha sido rastreado uma análise cuidadosa nos levou a descobrir que era necessário fazer mais alguns ajustes do rastreamento featuresGoogle settings.Other notável também lhe dá uma ferramenta que KeyMatch permite especificar quais os documentos indexados deve aparecer no topo da página de resultados para uma determinada consulta. Estes manifestam-se quase idêntica para os Links Patrocinados no topo da página dos resultados da Google que todos nós usamos. Uma ferramenta Sinónimo permite especificar palavras ou frases alternativas para consultas de pesquisa. Por exemplo, se alguém procura por WCM, você pode sugerir "Web Content Management" na parte superior da resultados apresentam formato page.An saída permite que você controle (através de um XSLT) a apresentação dos resultados da pesquisa. Você pode usar isto para mudar as fontes, cores, logotipo, cabeçalho, etc da página de resultados. Fomos capazes de remover facilmente o "cache" recurso na página de resultados com alguma ferramenta de relatório de XSLT modifications.The permite executar relatórios sobre consultas de pesquisa sobre intervalos de tempo diferentes. Ela vai mostrar o número de pesquisas por dia, por hora, as 100 palavras-chave e top 100 consultas para o período de tempo specified.DownsidesThe GSA não é para as organizações que buscam índice de suas unidades de rede compartilhada como o aparelho não tem facilidade para sistemas de rastreamento de arquivos. Isso é realmente muito ruim como luta de muitas empresas com a enorme quantidade de conteúdos não estruturados, armazenados em suas redes. Evidentemente, há uma infinidade de outros produtos lá fora, para exatamente isso issue.Access directamente às bases de dados (por exemplo, SQL Server, Oracle, etc) é outra área que está fora dos limites para a GSA, bem como qualquer tipo de integração com o conteúdo ou systems.ConclusionThe gestão de documentos Google Search Appliance (GSA) é um produto excelente para pesquisa HTTP conteúdo acessível. Ela dá grande controle sobre os recursos administrativos, tais como esteiras e configuração do serviço e resultados suficientes relatórios capacidades também. Aqueles que procuram uma solução para integrar diretamente com um índice / sistema de gestão de documentos, bases de dados, ou unidades de rede de indexação deve olhar para outro produto. No entanto, se você tem uma intranet ou site da intranet com abundância de conteúdo baseado em HTML a AES poderá ser apenas o que você need.Bryan Mjaanes é o criador / editor de Intranet101.com, uma comunidade baseada fórum para profissionais de Intranet.
Artigo Fonte: Messaggiamo.Com
Related:
» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy
Webmaster começa O Código do HTML
Adicionar este artigo para o seu site agora!
Webmaster enviar seus artigos
Nenhum registro necessário! Preencha o formulário e seu artigo está no Messaggiamo.Com Diretório!