Сегодня обсудили с Андреем Аксеновым мои тест-кейзы для поиска. Если ограничить фишки только задачами этого форма, то добавится вот что:
обработка словоформами составляющих blend-characters (которые слева и справа от минуса)
обработка регулярками входных данных (для нормализациии чисел, размерностей и т.п.)
появление для blend-characters третей формы, когда минус “схлопывается” (либо, как вариант - возможность это задать регуляркой.
с тех же регулярок - возможность построить собственные аналоги blend-characters (одновременно несколько форм слова в индексе)
в некоторых местах - уточнен порядок наложения словарей, стеммера, исключений и т.п.
По срокам - до нового года. Это только те вещи, у которых растут ноги от моих задач. Остальные секреты не мои, поэтому рассказывать буду только за деньги 😃 .
Предварительное “заседали-постановили” накропал в todo github.com/rcdesign/search-tune/ . Естественно, по бамажке еще не раз прокатимся катком и саблей, но куда все двигается - примерно понятно.
{"assets_hash":"a8b26fa7f6e768b07a72c8c9aadb9422","page_data":{"users":{"39c21abc3df9550077797d18":{"_id":"39c21abc3df9550077797d18","hid":349,"name":"Vitaly","nick":"Vitaly","avatar_id":null,"css":""}},"settings":{"blogs_can_create":false,"blogs_mod_can_delete":false,"blogs_mod_can_hard_delete":false,"blogs_mod_can_add_infractions":false,"can_report_abuse":false,"can_vote":false,"can_see_ip":false,"blogs_edit_comments_max_time":30,"blogs_show_ignored":false,"blogs_reply_old_comment_threshold":30,"votes_add_max_time":168},"entry":{"_id":"4e726d8a99707300771040d0","hid":12503,"title":"Sphinx search - срываем покровы","html":"<p>Сегодня обсудили с Андреем Аксеновым мои тест-кейзы для поиска. Если ограничить фишки только задачами этого форма, то добавится вот что:</p>\n<ul>\n<li>обработка словоформами составляющих blend-characters (которые слева и справа от минуса)</li>\n<li>обработка регулярками входных данных (для нормализациии чисел, размерностей и т.п.)</li>\n<li>появление для blend-characters третей формы, когда минус “схлопывается” (либо, как вариант - возможность это задать регуляркой.</li>\n<li>с тех же регулярок - возможность построить собственные аналоги blend-characters (одновременно несколько форм слова в индексе)</li>\n<li>в некоторых местах - уточнен порядок наложения словарей, стеммера, исключений и т.п.</li>\n</ul>\n<p>По срокам - до нового года. Это только те вещи, у которых растут ноги от моих задач. Остальные секреты не мои, поэтому рассказывать буду только за деньги <span class=\"emoji emoji-smiley\" data-nd-emoji-src=\":smiley:\">😃</span> .</p>\n<!--cut-->\n<p>Предварительное “заседали-постановили” накропал в todo <a href=\"https://github.com/rcdesign/search-tune/\" class=\"link link-ext link-auto\" data-nd-link-type=\"linkify\" data-nd-link-orig=\"https://github.com/rcdesign/search-tune/\" target=\"_blank\" rel=\"nofollow noopener\">github.com/rcdesign/search-tune/</a> . Естественно, по бамажке еще не раз прокатимся катком и саблей, но куда все двигается - примерно понятно.</p>\n","user":"39c21abc3df9550077797d18","ts":"2011-09-15T21:26:34.000Z","st":1,"cache":{"comment_count":0},"views":1182,"bookmarks":0,"votes":0},"subscription":null},"locale":"en-US","user_id":"000000000000000000000000","user_hid":0,"user_name":"","user_nick":"","user_avatar":null,"is_member":false,"settings":{"can_access_acp":false,"can_use_dialogs":false,"hide_heavy_content":false},"unread_dialogs":false,"footer":{"rules":{"to":"common.rules"},"contacts":{"to":"rco-nodeca.contacts"}},"navbar":{"tracker":{"to":"users.tracker","autoselect":false,"priority":10},"forum":{"to":"forum.index"},"blogs":{"to":"blogs.index"},"clubs":{"to":"clubs.index"},"market":{"to":"market.index.buy"}},"recaptcha":{"public_key":"6LcyTs0dAAAAADW_1wxPfl0IHuXxBG7vMSSX26Z4"},"layout":"common.layout"}