* [oss-gost-crypto] ГОСТ 34.10 и CryptoAPI (FYI progress update 2)
@ 2018-12-27 6:18 Vitaly Chikunov
2018-12-28 6:05 ` Vitaly Chikunov
2019-01-06 16:10 ` Vitaly Chikunov
0 siblings, 2 replies; 3+ messages in thread
From: Vitaly Chikunov @ 2018-12-27 6:18 UTC (permalink / raw)
To: oss-gost-crypto
On Sun, Dec 16, 2018 at 02:39:01AM +0300, Vitaly Chikunov wrote:
> Я посчитал статистику точнее (на одном ядре Xeon E5630 2.53GHz):
>
> кривая: 100 проверок / время = проверок в секунду
>
> gost2012_256-A: 100 / 0.462106 = 216.4
> gost2012_256-B: 100 / 6.567137 = 15.2
> gost2012_512-A: 100 / 3.159222 = 31.6
> gost2012_512-B: 100 / 50.422690 = 1.98
>
> Как уже говорил, gost2012_256-B можно сделать по скорости как
> gost2012_256-A, а gost2012_512-B как gost2012_512-A.
i) Добавил такие оптимизации: 1) пофиксил разложенеи по модулю для
кривых "B" (стали значительно быстрее, хоть и не на 100% так же как для
А); 2) замена в умножении (mul_64_64) четырех умножений u64 на одну
операцию с unsigned __int128; 3) сделал отдельную версию умножения
маленького числа на очень большое для использования в разложении по
модулю для специальных простых чисел (которые в кривых "A" и "B", но не
в "C"); 4) финальная операция проверки подписи сделана через Shamir's
trick, что сэкономило одно уможение скаляра на точку. Последние три
оптимизации каждая дают ускорение примерно в полтора-два раза. Так что
получился следующий бенчмарк:
gost2012_256-A 925.73734979911 (verify/s)
gost2012_256-B 743.48889599333
gost2012_512-A 199.76707159452
gost2012_512-B 172.92092844704
Думаю, на этом пока остановиться, так как стало более менее приемлемо.
Если кто-то захочет оптимизировать дальше, то welcome. Для сравнения
скорость gost-engine на этом же железе:
gost2012_256 A: sign: 865.5/s, verify: 1085.6/s
gost2012_256 B: sign: 891.5/s, verify: 1105.7/s
gost2012_256 C: sign: 907.4/s, verify: 1096.2/s
gost2012_512 A: sign: 231.0/s, verify: 324.2/s
gost2012_512 B: sign: 223.9/s, verify: 336.9/s.
ii) Кривая gost2012_256-C благодаря Shamir's trick стала вычисляться,
так как пропал X=0. Но все равно она осталась очень медленной из-за
того, что разложение по модулю для нее не оптимизировано. Всё таки я
хочу отложить её до лучших времен. И так в ядре всего две NIST кривые, а
ГОСТовых уже может быть четыре (а всего стандартизовано семь).
Как обычно, черновая рабочая версия тут
https://github.com/vt-alt/linux/tree/ecrdsa
ps. Herbert Xu сегодня послал pull request с новым crypto со стрибогом
Линусу.
^ permalink raw reply [flat|nested] 3+ messages in thread
* Re: [oss-gost-crypto] ГОСТ 34.10 и CryptoAPI (FYI progress update 2)
2018-12-27 6:18 [oss-gost-crypto] ГОСТ 34.10 и CryptoAPI (FYI progress update 2) Vitaly Chikunov
@ 2018-12-28 6:05 ` Vitaly Chikunov
2019-01-06 16:10 ` Vitaly Chikunov
1 sibling, 0 replies; 3+ messages in thread
From: Vitaly Chikunov @ 2018-12-28 6:05 UTC (permalink / raw)
To: oss-gost-crypto
Hi,
On Thu, Dec 27, 2018 at 09:18:52AM +0300, Vitaly Chikunov wrote:
> ps. Herbert Xu сегодня послал pull request с новым crypto со стрибогом
> Линусу.
Всё, попало в master.
$ git log --grep streebog --oneline torvalds/master
b71acb0e3721 Merge branch 'linus' of git://git.kernel.org/pub/scm/linux/kernel/git/herbert/crypto-2.6
25a0b9d4e512 crypto: streebog - add Streebog test vectors
dfdda82e3b84 crypto: streebog - register Streebog in hash info for IMA
fe18957e8e87 crypto: streebog - add Streebog hash function
Значит будет в 4.21 и всех его rc.
^ permalink raw reply [flat|nested] 3+ messages in thread
* Re: [oss-gost-crypto] ГОСТ 34.10 и CryptoAPI (FYI progress update 2)
2018-12-27 6:18 [oss-gost-crypto] ГОСТ 34.10 и CryptoAPI (FYI progress update 2) Vitaly Chikunov
2018-12-28 6:05 ` Vitaly Chikunov
@ 2019-01-06 16:10 ` Vitaly Chikunov
1 sibling, 0 replies; 3+ messages in thread
From: Vitaly Chikunov @ 2019-01-06 16:10 UTC (permalink / raw)
To: oss-gost-crypto
Hi,
On Thu, Dec 27, 2018 at 09:18:52AM +0300, Vitaly Chikunov wrote:
> i) Добавил такие оптимизации: 1) пофиксил разложенеи по модулю для
> кривых "B" (стали значительно быстрее, хоть и не на 100% так же как для
> А); 2) замена в умножении (mul_64_64) четырех умножений u64 на одну
> операцию с unsigned __int128; 3) сделал отдельную версию умножения
> маленького числа на очень большое для использования в разложении по
> модулю для специальных простых чисел (которые в кривых "A" и "B", но не
> в "C"); 4) финальная операция проверки подписи сделана через Shamir's
> trick, что сэкономило одно уможение скаляра на точку. Последние три
> оптимизации каждая дают ускорение примерно в полтора-два раза. Так что
> получился следующий бенчмарк:
>
> gost2012_256-A 925.73734979911 (verify/s)
> gost2012_256-B 743.48889599333
> gost2012_512-A 199.76707159452
> gost2012_512-B 172.92092844704
>
> Думаю, на этом пока остановиться, так как стало более менее приемлемо.
> Если кто-то захочет оптимизировать дальше, то welcome. Для сравнения
> скорость gost-engine на этом же железе:
>
> gost2012_256 A: sign: 865.5/s, verify: 1085.6/s
> gost2012_256 B: sign: 891.5/s, verify: 1105.7/s
> gost2012_256 C: sign: 907.4/s, verify: 1096.2/s
> gost2012_512 A: sign: 231.0/s, verify: 324.2/s
> gost2012_512 B: sign: 223.9/s, verify: 336.9/s.
>
> ii) Кривая gost2012_256-C благодаря Shamir's trick стала вычисляться,
> так как пропал X=0. Но все равно она осталась очень медленной из-за
> того, что разложение по модулю для нее не оптимизировано. Всё таки я
> хочу отложить её до лучших времен. И так в ядре всего две NIST кривые, а
> ГОСТовых уже может быть четыре (а всего стандартизовано семь).
1. Таки я сделал Barrett's reduction для кривой C, скорость
gost2012_256-C 662.769581527289 (verify/s)
что меня устраивает.
2. Послал RFC с GOST 34.10:
https://patchwork.kernel.org/project/linux-crypto/list/?series=62661
^ permalink raw reply [flat|nested] 3+ messages in thread
end of thread, other threads:[~2019-01-06 16:10 UTC | newest]
Thread overview: 3+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2018-12-27 6:18 [oss-gost-crypto] ГОСТ 34.10 и CryptoAPI (FYI progress update 2) Vitaly Chikunov
2018-12-28 6:05 ` Vitaly Chikunov
2019-01-06 16:10 ` Vitaly Chikunov
Open-source aspects of GOST Cryptography
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/oss-gost-crypto/0 oss-gost-crypto/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 oss-gost-crypto oss-gost-crypto/ http://lore.altlinux.org/oss-gost-crypto \
oss-gost-crypto@lists.altlinux.org oss-gost-crypto@lists.altlinux.ru oss-gost-crypto@lists.altlinux.com
public-inbox-index oss-gost-crypto
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.oss-gost-crypto
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git