kkamegawa's weblog

Visual Studio,TFS,ALM,VSTS,DevOps関係のことについていろいろと書いていきます。Google Analyticsで解析を行っています

VSTS の新しいWork Item Searchで日本語検索を試す

Connect()で新しいWork Item Searchがプレビュー公開されました。

blogs.msdn.microsoft.com

今までのWork Item検索は英語版のSQL Serverをバックエンドにしているからか、Titleではかろうじて日本語検索ができたものの、Descriptionに書かれている日本語を検索対象にすることができませんでした。オンプレミスTFSではSQL Serverに日本語Word Breakerを追加しておけばできるはずです。

検索用のワード ブレーカーとステミング機能の構成と管理

幸いにも私のアカウントではもう有効になっているので、さっそく試してみましょう。

f:id:kkamegawa:20161120180621p:plain

こんな感じで"Microsoft"という文字を大文字小文字含む、全角大文字小文字、全部大文字を追加して検索できるかどうか試してみます。

f:id:kkamegawa:20161120180620p:plain

もう一つが忘れてはいけない絵文字。Windows 10のソフトキーボードから入力したのですが、Descriptionではカラーで表示されないようですね。ちなみに検索ボックスではちゃんとカラーで表示されます。

f:id:kkamegawa:20161120180622p:plain

普通に「Microsoft」と検索した場合。まぁ普通に出ますね。

f:id:kkamegawa:20161120180624p:plain

全部大文字で検索した場合も出ますね。

f:id:kkamegawa:20161120180625p:plain

「ウェブサイト」という単語に対して、「ウェブ」で検索するとヒットしません。カタカナの部分一致はダメなようです。

f:id:kkamegawa:20161120180626p:plain

「ウェブサイト」と書くと検索されます。

f:id:kkamegawa:20161120202908p:plain

*を指定すると、先頭からの部分一致検索を行うことができるようです。後方一致は無理なようです。正規表現はどうかな…。

f:id:kkamegawa:20161120180623p:plain

全角のMicrosoftで検索してもちゃんとヒットします。こちらは文字幅を見ているわけではなく、Discussionにある全角の文字と一致しているためのようです。

f:id:kkamegawa:20161120180628p:plain

半角カナの「データ」で検索してもヒットしません。カナの幅は同一視していないようです。

f:id:kkamegawa:20161120202909p:plain

サロゲートペアも試してみます。

f:id:kkamegawa:20161120202910p:plain

𩹉が検索できないようです…。

f:id:kkamegawa:20161120180627p:plain

サロゲートペアが検索できないので、当然絵文字(ここではなぜかカラー表示)の検索もできないようです。

まとめてみると、SQL Serverの照合順序でいえば、CI_AS_KS_WSという感じでしょうか(_SCは非対応)。日本語の文字を検索するときはちょっと工夫が必要になるでしょうが(特に英数字を全角で書きたがる人とか)、以前より飛躍的に良くなっています。

とりあえず現在は課金対象ではないようなので、ぜひ使ってフィードバックしてみてください。サロゲートペア対応は個人的にフィードバックしようかなと思っています。

注:この検証は記事執筆時点の情報に基づいています。将来にわたって同じとは限りません。