Sphinx search - срываем покровы

Сегодня обсудили с Андреем Аксеновым мои тест-кейзы для поиска. Если ограничить фишки только задачами этого форма, то добавится вот что:

  • обработка словоформами составляющих blend-characters (которые слева и справа от минуса)
  • обработка регулярками входных данных (для нормализациии чисел, размерностей и т.п.)
  • появление для blend-characters третей формы, когда минус “схлопывается” (либо, как вариант - возможность это задать регуляркой.
  • с тех же регулярок - возможность построить собственные аналоги blend-characters (одновременно несколько форм слова в индексе)
  • в некоторых местах - уточнен порядок наложения словарей, стеммера, исключений и т.п.

По срокам - до нового года. Это только те вещи, у которых растут ноги от моих задач. Остальные секреты не мои, поэтому рассказывать буду только за деньги 😃 .

Предварительное “заседали-постановили” накропал в todo github.com/rcdesign/search-tune/ . Естественно, по бамажке еще не раз прокатимся катком и саблей, но куда все двигается - примерно понятно.

  • 1181