検討: イントラネットの環境のgoogleの調査の電気器具の実行
私達の団体のイントラネットははす両方ドミノおよびIISの非組み立てられた環境である(。純および古典的な非対称多重処理システムの)適用および内容。 私達はWebコンテンツの300,000-500,000ページの間で持ち、文書はを渡るおよそ30の独特な範囲で以上1200年「土地を選定する」。 私達に年齢のように始めていた私達のイントラネットのサーチエンジンとしてInktomiのUltraSeekサーバー3.0があるのが常であった(1998年に購入される)見え。 Inktomiプロダクトは付属品を(DOC、PPT、PDF、等)よく扱わなかったし、私達の安全なサイト這わなかったし、そして売り手によってもはや支えられた。 私達は調査の売り手のおおざっぱな検討をし、彼らのGoogleの調査の電気器具(GSA)のためのGoogleの30日間の試験の提供にすぐに引き付けられた。 標準的な一致に署名した後、彼らは私達を私達が30日間戻るか、または購入する前にテストできる真新しい光沢がある黄色い単位出荷した。
プロダクト情報
GSAは「ブラックボックス」1U標準的な棚取付け可能なサーバーである。 「」私が意味するブラックボックスによって、Google装置を管理するために与えたり網インターフェイスをしかしオペレーティングシステムにアクセスしてほしくない(Linuxの重くGoogleカスタマイズされた版)。 実際は、特許権実施契約はどうにか電気器具のハードウェアかOSを改竄しないことを規定する。 装置にキーボード、マウスまたはビデオのための必要性がないか。 あなたが正常運営のために必要とするのはネットワークケーブルおよび標準的な入力だけである。
GSAは異なった味ハードウェアのサイズおよび相応じて免許証のサイズによって変わる異なった必要性に合うことを入って来。 (認可は電気器具によってURLの数に這った基づいている。) 3つのハードウエアコンフィギュレーションがある; GB-1001、GB-5005およびGB-800。 これらは次の通り破壊される;
GB-1001か。 $28Kのための150K文書、$50Kのための300K文書 GB-5005か。 $230Kのための1.5Mの文書 GB-8008か。 $450Kのための4Mの文書
なぜGoogleか。
広告されるように、GSAは私達が私達の環境で持っているファイル・タイプ、アクセスによってしっかり止められている内容の大きい変化を満たし、文書化されたAPI指示、できる私達の必要性すべてを等を持っている。 Googleのブランド力はもう一つの大きい販売の要因だった。 それらはGoogle基づかせていたサーチエンジンを得ようとするように私達が私達のユーザーに言ったときに知っていた悩まされていた捜索の日が終わったことを。 最後に、私達が取り引き密封されたGSAと持っていた30日間の試運転の経験。 電気器具は私が取付け、形成し、維持しなければなったあらないことは最も容易な企業の解決である。 私達は荷箱の開始の1時間以内に文字通り作動中だった。
取付け
電気器具にバックパネルの2つのネットワークポートがある; 正常運営のための1つおよびネットワーク・コンフィギュレーションに専ら使用する他。 ネットワークの設定を形成するためには私達は含まれている特別な(あるピン出口は標準外である)オレンジイーサネットケーブルによって電気器具にラップトップを接続した。 インストールプロセスは1つが「ブラックボックスのために」。想像できると約容易だった
最初に次に私達は正常運営ネットワークケーブルおよび力のプラグを差し込んだ。 電気器具のパワープラグは電源スイッチである; つけ、それを消すためにそれをプラグを抜くようにそれのプラグを差し込みなさい。 それのプラグを差し込んだ後、私達は電気器具が続く信号である調子をすることができるように約5分を待っていた。 次に、私達は私達のラップトップの上で電気器具に(既にDHCPモードに置かれる)それ動力を与えられて引っ掛かり。 私達のラップトップへのログオンし、確認の後で私達は正しいIPを私達によってがネットワークの設定を形成して準備ができている電気器具の作り付けDHCPサーバーによって割り当ててもらった。 総経過時間(格納装置を除いて): 10分。
構成
ネットワーク・コンフィギュレーションは、正常な管理のようなブラウザを通して、完全に行われ、簡単な5つのステッププロセスである。 最初のスクリーンは基本的なネットワーク情報を頼む; IPアドレス、サブネット・マスク、規定のゲートウェイおよびDNS。 それに続くスクリーンは」GSAの通告メッセージのための住所からのSMTPサーバーを、「、時間帯、NTP (時間)サーバーおよびadminのアカウントネームまたはパスワード集める。 最後のステップは組み立てを正しくするために確かめるためにあなたが這う少数のURLをテストすることである。 最終的な設定の検討スクリーン構成が完全およびだった後そしてあなたのラップトップのプラグを抜き、よい部分に得ることができる; 開始の這うこと。 総経過時間: 10分。
場所這う
URLを使用して、GSAのすべての管理遠隔にされる提供した。 私達が前のステップで、私達提供したID/passwordとのログオンの後で管理コンソールによって示された。 私達はへの同じURLが「URLだけ次のパターン」箱が付いているそして私達がされた続き、這い、こと」コピーされたURLから這う「開始に置かれた私達の索引を保持するために新しいコレクションを作成した。 私達は私達の設定を救い、次に「開始這う」ボタンをかちりと鳴らした。 私達は「除行状態」のスクリーンにそれから行き、「這われたURL」の反対の増加を見た。 Googleはのまたはそう約4,000 URL約15分這うことができること広告する。 私達はそれらのURLからにつながる文書(単語、PDF、Excel、等)があれば除行の時間がかなり増加することを見つけた。
除行が行われた後コレクションは自動的に指示され、サービングの前提条件(あらゆる規準定めるのに生産に索引コレクションを動かすためにかどうか使用したい)およびコレクションに対してそれから点検されて生産(従っておよび捜せる)にまたは足場に動かされるために動かされる。 中間準備地域はそれらに対してユーザの検索を許可する前に新しい除行を認可することを可能にする。
這う構成
あなたの最初除行の後で戻り、這う変数をひねる必要性を見つけるかもしれない。 Googleは何本糸が使用されるか場所がいかにの這うか相当制御、頻度を、等与える。 保証の場所のために、GSAは基本的な認証を支え、形態の証明を支える付加的な保証モジュールは利用できる。 私達のための最も挑戦的な構成面は調査から除くためにURLパターンの正しいコンビネーションを定めていた。 ドミノの店およびGSAを使用するために見ることなら時々複雑なドミノの問い合わせのひも変数を支えるためにクローラー構成をちょうど正しく得る時間を使う必要がある場合もある。
私達が除行変数を調整されておよび得た後できていた最初の完全な除行私達はクローラーがすべての内容をつかんだかどうか見るためにテストをした。 私達の場所を拾い読みし、あるひもとのテストはGSAはそれら正確に這ったことを私達が常に見つけた分類学の中の深い埋めた。 私達はまたPDF文書、PowerPointの提示の中のひもとのテストを等した。 私達が出くわしたときに注意深い分析這わなかった何かは私達を私達が除行の設定のもう少しのひねることをする必要があったことを発見するために導いた。
他の著しい特徴
Googleはまた文書を現われるべきである指示したかどれがある特定の問い合わせのための結果のページの上に指定することを可能にするKeyMatch用具を与える。 これらの明らか彼ら自身私達がすべて使用するGoogleの結果のページの上の後援されたリンクとほとんど全く同じに。 同義語用具は調査の問い合わせのために互い違いの単語か句を指定することを可能にする。 例えば、誰かがWCMを捜せば、結果のページの上で「Webコンテンツ管理」を提案できる。
出力フォーマットの特徴は(XSLTによって)調査の結果の提示を制御することを可能にする。 結果のページの壷、色、ロゴ、ヘッダー、等を変えるためにこれを使用できる。 私達は容易にXSLTの修正と結果のページの「貯蔵された」特徴を取除けた。
報告用具はさまざまな時間範囲上の調査の問い合わせのレポートを動かすことを可能にする。 それは指定された期限の時間、上の100つのキーワードおよび上100の問い合わせごとの1日あたりの調査の数を、示す。
マイナス面
GSAは共用回線網ドライブを指示するために見る組織のため電気器具に這うファイルシステムのための設備がないのでではない。 これはネットワークで貯えられる巨大な量の未構造化の内容と実際に余りに悪い同様に多くの会社戦う。 当然、丁度この問題のため他のプロダクトのそこに茄多である。
データベース(例えばSQL、Oracle、等)へのアクセスは直接あらゆる種類の内容または文書管理システムとの統合と同様、GSAのために立入禁止のもう一つの区域である。
結論
Googleの調査の電気器具(GSA)はHTTP入手しやすい内容のための優秀な調査プロダクトである。 それはおよび十分な報告の機能また役立つクローラー構成のような管理上の特徴の大きい制御をおよび結果与える。 内容または文書管理システム、データベースと直接統合するために解決を捜すか、またはネットワーク・ドライブを指示するそれらは別のプロダクトに見るべきである。 但し、沢山のHTML基づかせていた内容のイントラネットかイントラネットの場所があればGSAはかもしれないちょうどである必要とするかもの。
Bryan Mjaanesは
Intranet101.comの創作者または編集者、イントラネットの専門家のためのcommunity-basedフォーラムである。
記事のソース: Messaggiamo.Com
Related:
» Home Made Power Plant
» Singorama
» Criminal Check
» Home Made Energy
ウェブマスター向けのHTMLコードを取得
この記事を追加してお客様のウェブサイトを今しなさい!
ウェブマスター向けの記事を送信してください
登録の必要なし!フォームに記入してください Messaggiamo.Com 記事は、ディレクトリ!