From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Sun, 6 Jan 2019 19:10:56 +0300 From: Vitaly Chikunov To: oss-gost-crypto@lists.altlinux.org Message-ID: <20190106161056.icemlafjfq6jzhln@sole.flsd.net> References: <20181227061852.4hdhmdfbrckvi5fn@sole.flsd.net> MIME-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit In-Reply-To: <20181227061852.4hdhmdfbrckvi5fn@sole.flsd.net> User-Agent: NeoMutt/20171215-106-ac61c7 Subject: Re: [oss-gost-crypto] =?koi8-r?b?5+/z9CAzNC4xMCDJICBDcnlwdG9BUEkgKEZZ?= =?koi8-r?b?SSBwcm9ncmVzcyB1cGRhdGUgMik=?= X-BeenThere: oss-gost-crypto@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: Open-source aspects of GOST Cryptography List-Id: Open-source aspects of GOST Cryptography List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sun, 06 Jan 2019 16:10:57 -0000 Archived-At: List-Archive: Hi, On Thu, Dec 27, 2018 at 09:18:52AM +0300, Vitaly Chikunov wrote: > i) Добавил такие оптимизации: 1) пофиксил разложенеи по модулю для > кривых "B" (стали значительно быстрее, хоть и не на 100% так же как для > А); 2) замена в умножении (mul_64_64) четырех умножений u64 на одну > операцию с unsigned __int128; 3) сделал отдельную версию умножения > маленького числа на очень большое для использования в разложении по > модулю для специальных простых чисел (которые в кривых "A" и "B", но не > в "C"); 4) финальная операция проверки подписи сделана через Shamir's > trick, что сэкономило одно уможение скаляра на точку. Последние три > оптимизации каждая дают ускорение примерно в полтора-два раза. Так что > получился следующий бенчмарк: > > gost2012_256-A 925.73734979911 (verify/s) > gost2012_256-B 743.48889599333 > gost2012_512-A 199.76707159452 > gost2012_512-B 172.92092844704 > > Думаю, на этом пока остановиться, так как стало более менее приемлемо. > Если кто-то захочет оптимизировать дальше, то welcome. Для сравнения > скорость gost-engine на этом же железе: > > gost2012_256 A: sign: 865.5/s, verify: 1085.6/s > gost2012_256 B: sign: 891.5/s, verify: 1105.7/s > gost2012_256 C: sign: 907.4/s, verify: 1096.2/s > gost2012_512 A: sign: 231.0/s, verify: 324.2/s > gost2012_512 B: sign: 223.9/s, verify: 336.9/s. > > ii) Кривая gost2012_256-C благодаря Shamir's trick стала вычисляться, > так как пропал X=0. Но все равно она осталась очень медленной из-за > того, что разложение по модулю для нее не оптимизировано. Всё таки я > хочу отложить её до лучших времен. И так в ядре всего две NIST кривые, а > ГОСТовых уже может быть четыре (а всего стандартизовано семь). 1. Таки я сделал Barrett's reduction для кривой C, скорость gost2012_256-C 662.769581527289 (verify/s) что меня устраивает. 2. Послал RFC с GOST 34.10: https://patchwork.kernel.org/project/linux-crypto/list/?series=62661