самый быстрый memcpy

Сейчас на форуме: tyns777, zds, JustLife (+4 невидимых)

. 1 . 2 . >>

Посл.ответ	Сообщение
Vol4ok Ранг: 47.1 (посетитель), 2thx Активность: 0.03↘0 Статус: Участник	Создано: 15 февраля 2010 19:08 · Поправил: Vol4ok · Личное сообщение · #1 Протестируйте на предмет самой быстрой реализации memcpy -бэнчмэк В нем содержится множество различных реализаций memcpy начиная от SSE заканчивая простым циклом. Заодно это отличный способ оценить скорость работы с памятью на компе. Результаты кидайте сюда, вместе с процом на котором тестировали. Мои результаты для Core2Duo 2.26 Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! // MMX реализация на асме с prefetch mmx_memcpy_asm: ttl: 0.114444 s avr: 0.007153 s spd: 2237 mb/s // MMX реализация на intrinsic инструкциях c prefetch mmx_memcpy: ttl: 0.115609 s avr: 0.007226 s spd: 2214 mb/s // очень хитрая на MMX под AMD c prefetch memcpy_huge: ttl: 0.111493 s avr: 0.006968 s spd: 2296 mb/s //реализация на SSE sse_memcpy_asm: ttl: 0.177681 s avr: 0.011105 s spd: 1441 mb/s //реализация на SSE c prefetch sse_memcpy_asm2: ttl: 0.143008 s avr: 0.008938 s spd: 1790 mb/s //реализация на SSE на intrinsic инструкциях sse_memcpy: ttl: 0.183768 s avr: 0.011486 s spd: 1393 mb/s //реализация на SSE на intrinsic инструкциях без выравнивания sse_memcpy_u: ttl: 0.189657 s avr: 0.011854 s spd: 1350 mb/s //цикл rep movsd movsd: ttl: 0.181586 s avr: 0.011349 s spd: 1410 mb/s //ntdll RtlCopyMemory RtlCopyMemory: ttl: 0.200333 s avr: 0.012521 s spd: 1278 mb/s //crt memcpy_s memcpy_s: ttl: 0.207848 s avr: 0.012990 s spd: 1232 mb/s //цикл for c копированием по 4B for loop (dword): ttl: 0.204562 s avr: 0.012785 s spd: 1251 mb/s //цикл while c копированием по 4B while loop (dword): ttl: 0.197684 s avr: 0.012355 s spd: 1295 mb/s //цикл while c копированием по 1B for loop (byte): ttl: 0.276843 s avr: 0.017303 s spd: 925 mb/s ЗЫ: если есть еще идеи для реализации быстрой memcpy, то кидайте сюда, если это будет актуально то включу в бэнчмэк.

ntldr Ранг: 369.8 (мудрец), 400thx Активность: 0.39↘0 Статус: Участник	Создано: 15 февраля 2010 19:16 · Личное сообщение · #2 Какую-то херню он у тебя выдает. mmx_memcpy_asm: ttl: 3.950031 s avr: 0.246877 s spd: 65 mb/s У меня Core i7, а не пентиум 1. Ищи баг. Примерно то-же самое выдает не Core i5. ----- PGP key <0x1B6A24550F33E44A>
TrueLies Ранг: 192.7 (ветеран), 154thx Активность: 0.07↘0 Статус: Участник The ONE	Создано: 15 февраля 2010 19:27 · Личное сообщение · #3 Intel Core 2 Quad 2,66 (Win 7) Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 3.553828 s avr: 0.222114 s spd: 72 mb/s mmx_memcpy: ttl: 3.520875 s avr: 0.220055 s spd: 73 mb/s memcpy_huge: ttl: 3.837970 s avr: 0.239873 s spd: 67 mb/s sse_memcpy_asm: ttl: 3.042574 s avr: 0.190161 s spd: 84 mb/s sse_memcpy_asm2: ttl: 2.979471 s avr: 0.186217 s spd: 86 mb/s sse_memcpy: ttl: 3.035924 s avr: 0.189745 s spd: 84 mb/s sse_memcpy_u: ttl: 3.638194 s avr: 0.227387 s spd: 70 mb/s movsd: ttl: 8.262453 s avr: 0.516403 s spd: 31 mb/s RtlCopyMemory: ttl: 8.220791 s avr: 0.513799 s spd: 31 mb/s memcpy_s: ttl: 2.972370 s avr: 0.185773 s spd: 86 mb/s for loop (dword): ttl: 8.196832 s avr: 0.512302 s spd: 31 mb/s ----- Сотрудник DHARMA
Clerk Ранг: 255.8 (наставник), 19thx Активность: 0.15↘0.01 Статус: Участник vx	Создано: 15 февраля 2010 19:40 · Личное сообщение · #4 rep movsd самый быстрый(4, 8 etc. байт не учитываются), иначе типо mov и пр. быстрее. Кстате в юзермоде профайленг это изврат
DaRKSiDE Ранг: 462.8 (мудрец), 468thx Активность: 0.28↘0 Статус: Участник Only One!	Создано: 15 февраля 2010 19:43 · Поправил: DaRKSiDE · Личное сообщение · #5 Pentium 4 - 2.60 GHz Code: mmx_memcpy_asm: ttl: 0.210096 s avr: 0.013131 s spd: 1218 mb/s mmx_memcpy: ttl: 0.212673 s avr: 0.013292 s spd: 1204 mb/s memcpy_huge: ttl: 0.196439 s avr: 0.012277 s spd: 1303 mb/s sse_memcpy_asm: ttl: 0.321834 s avr: 0.020115 s spd: 795 mb/s sse_memcpy_asm2: ttl: 0.211145 s avr: 0.013197 s spd: 1212 mb/s sse_memcpy: ttl: 0.320157 s avr: 0.020010 s spd: 800 mb/s sse_memcpy_u: ttl: 0.326868 s avr: 0.020429 s spd: 783 mb/s movsd: ttl: 0.323771 s avr: 0.020236 s spd: 791 mb/s RtlCopyMemory: ttl: 0.324805 s avr: 0.020300 s spd: 788 mb/s memcpy_s: ttl: 0.324114 s avr: 0.020257 s spd: 790 mb/s for loop (dword): ttl: 0.326095 s avr: 0.020381 s spd: 785 mb/s while loop (dword): ttl: 0.381432 s avr: 0.023840 s spd: 671 mb/s for loop (byte): ttl: 1.003495 s avr: 0.062718 s spd: 255 mb/s ----- aLL rIGHTS rEVERSED!
ntldr Ранг: 369.8 (мудрец), 400thx Активность: 0.39↘0 Статус: Участник	Создано: 15 февраля 2010 19:44 · Личное сообщение · #6 Clerk пишет: rep movsd самый быстрый Это отнюдь не так. Копирование через mmx/sse с записью мимо кэша работает существенно быстрее на больших выравненных на 16 блоках памяти. ----- PGP key <0x1B6A24550F33E44A>
SER[G]ANT Ранг: 147.7 (ветеран), 50thx Активность: 0.12↘0 Статус: Участник sv_cheats 1	Создано: 15 февраля 2010 19:52 · Поправил: SER[G]ANT · Личное сообщение · #7 AMD Athlon II x2 250 (2.99 ГГц) Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.090227 s avr: 0.005639 s spd: 2837 mb/s mmx_memcpy: ttl: 0.097013 s avr: 0.006063 s spd: 2639 mb/s memcpy_huge: ttl: 0.086159 s avr: 0.005385 s spd: 2971 mb/s sse_memcpy_asm: ttl: 0.139476 s avr: 0.008717 s spd: 1835 mb/s sse_memcpy_asm2: ttl: 0.095687 s avr: 0.005980 s spd: 2675 mb/s sse_memcpy: ttl: 0.142094 s avr: 0.008881 s spd: 1802 mb/s sse_memcpy_u: ttl: 0.141432 s avr: 0.008840 s spd: 1810 mb/s movsd: ttl: 0.146729 s avr: 0.009171 s spd: 1745 mb/s RtlCopyMemory: ttl: 0.146193 s avr: 0.009137 s spd: 1751 mb/s memcpy_s: ttl: 0.160891 s avr: 0.010056 s spd: 1591 mb/s for loop (dword): ttl: 0.153589 s avr: 0.009599 s spd: 1667 mb/s while loop (dword): ttl: 0.155292 s avr: 0.009706 s spd: 1649 mb/s for loop (byte): ttl: 0.224935 s avr: 0.014058 s spd: 1138 mb/s
ntldr Ранг: 369.8 (мудрец), 400thx Активность: 0.39↘0 Статус: Участник	Создано: 15 февраля 2010 19:56 · Личное сообщение · #8 Имхо он выложил баговую версию. Мои результаты и близко не похожи на правду. ----- PGP key <0x1B6A24550F33E44A>
s0l Ранг: 60.6 (постоянный), 20thx Активность: 0.07↘0 Статус: Участник	Создано: 15 февраля 2010 20:42 · Личное сообщение · #9 Intel Pentium D-915 2.80GHz Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 6.028324 s avr: 0.376770 s spd: 42 mb/s mmx_memcpy: ttl: 6.077168 s avr: 0.379823 s spd: 42 mb/s memcpy_huge: ttl: 6.777012 s avr: 0.423563 s spd: 38 mb/s sse_memcpy_asm: ttl: 4.391586 s avr: 0.274474 s spd: 58 mb/s sse_memcpy_asm2: ttl: 4.362426 s avr: 0.272652 s spd: 59 mb/s sse_memcpy: ttl: 4.404981 s avr: 0.275311 s spd: 58 mb/s sse_memcpy_u: ttl: 6.197998 s avr: 0.387375 s spd: 41 mb/s movsd: ttl: 13.480033 s avr: 0.842502 s spd: 19 mb/s RtlCopyMemory: ttl: 13.685979 s avr: 0.855374 s spd: 19 mb/s memcpy_s: ttl: 4.416383 s avr: 0.276024 s spd: 58 mb/s for loop (dword): ttl: 13.604286 s avr: 0.850268 s spd: 19 mb/s while loop (dword): ttl: 13.531449 s avr: 0.845716 s spd: 19 mb/s
Vol4ok Ранг: 47.1 (посетитель), 2thx Активность: 0.03↘0 Статус: Участник	Создано: 15 февраля 2010 21:19 · Личное сообщение · #10 хм, действительно странно, у меня нормально работает. Тестирование временно отменяется, пока не разберусь почему такие мелкие скорости.
huckfuck Ранг: 49.6 (посетитель), 9thx Активность: 0.03↘0 Статус: Участник	Создано: 15 февраля 2010 21:22 · Поправил: huckfuck · Личное сообщение · #11 Athlon X2 4800+ 2,5 ГГц Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 2.957761 s avr: 0.184860 s spd: 87 mb/s mmx_memcpy: ttl: 2.972765 s avr: 0.185798 s spd: 86 mb/s memcpy_huge: ttl: 3.252638 s avr: 0.203290 s spd: 79 mb/s sse_memcpy_asm: ttl: 2.970238 s avr: 0.185640 s spd: 86 mb/s sse_memcpy_asm2: ttl: 2.965514 s avr: 0.185345 s spd: 86 mb/s sse_memcpy: ttl: 2.981480 s avr: 0.186342 s spd: 86 mb/s sse_memcpy_u: ttl: 2.976424 s avr: 0.186027 s spd: 86 mb/s movsd: ttl: 8.500210 s avr: 0.531263 s spd: 30 mb/s RtlCopyMemory: ttl: 8.502753 s avr: 0.531422 s spd: 30 mb/s memcpy_s: ttl: 2.961285 s avr: 0.185080 s spd: 86 mb/s for loop (dword): ttl: 8.439207 s avr: 0.527450 s spd: 30 mb/s while loop (dword): ttl: 8.451844 s avr: 0.528240 s spd: 30 mb/s for loop (byte): ttl: 33.736426 s avr: 2.108527 s spd: 8 mb/s
Jupiter Ранг: 605.2 (!), 341thx Активность: 0.47↘0.25 Статус: Модератор Research & Development	Создано: 15 февраля 2010 21:22 · Личное сообщение · #12 на asmcommunity.net неоднократно тема поднималась, посмотри и там. ----- EnJoy!
Vol4ok Ранг: 47.1 (посетитель), 2thx Активность: 0.03↘0 Статус: Участник	Создано: 15 февраля 2010 22:02 · Поправил: Vol4ok · Личное сообщение · #13 замечательный баг, который не проявляет себя под виртуалкой)). Версия испралена - тестирование продолжается. (ссылка таже)
_ruzmaz_ Ранг: 114.8 (ветеран), 41thx Активность: 0.1↘0 Статус: Участник	Создано: 15 февраля 2010 22:14 · Личное сообщение · #14 Vol4ok пишет: замечательный баг, который не проявляет себя под виртуалкой)). а подробней можно?)) Intel Celeron E1400 3.2 GHz Code: mmx_memcpy_asm: ttl: 0.202681 s avr: 0.012668 s spd: 1263 mb/s mmx_memcpy: ttl: 0.197569 s avr: 0.012348 s spd: 1296 mb/s memcpy_huge: ttl: 0.175040 s avr: 0.010940 s spd: 1463 mb/s sse_memcpy_asm: ttl: 0.390584 s avr: 0.024412 s spd: 655 mb/s sse_memcpy_asm2: ttl: 0.217836 s avr: 0.013615 s spd: 1175 mb/s sse_memcpy: ttl: 0.403958 s avr: 0.025247 s spd: 634 mb/s sse_memcpy_u: ttl: 0.398452 s avr: 0.024903 s spd: 642 mb/s movsd: ttl: 0.361364 s avr: 0.022585 s spd: 708 mb/s RtlCopyMemory: ttl: 0.362814 s avr: 0.022676 s spd: 706 mb/s memcpy_s: ttl: 0.399609 s avr: 0.024976 s spd: 641 mb/s for loop (dword): ttl: 0.396787 s avr: 0.024799 s spd: 645 mb/s while loop (dword): ttl: 0.400570 s avr: 0.025036 s spd: 639 mb/s for loop (byte): ttl: 0.394031 s avr: 0.024627 s spd: 650 mb/s
ntldr Ранг: 369.8 (мудрец), 400thx Активность: 0.39↘0 Статус: Участник	Создано: 15 февраля 2010 22:21 · Личное сообщение · #15 Core i7 2.93 ггц Code: mmx_memcpy_asm: ttl: 0.046526 s avr: 0.002908 s spd: 5502 mb/s mmx_memcpy: ttl: 0.046837 s avr: 0.002927 s spd: 5466 mb/s memcpy_huge: ttl: 0.053809 s avr: 0.003363 s spd: 4758 mb/s sse_memcpy_asm: ttl: 0.058576 s avr: 0.003661 s spd: 4370 mb/s sse_memcpy_asm2: ttl: 0.044150 s avr: 0.002759 s spd: 5798 mb/s sse_memcpy: ttl: 0.058943 s avr: 0.003684 s spd: 4343 mb/s sse_memcpy_u: ttl: 0.059075 s avr: 0.003692 s spd: 4333 mb/s movsd: ttl: 0.051868 s avr: 0.003242 s spd: 4936 mb/s RtlCopyMemory: ttl: 0.052099 s avr: 0.003256 s spd: 4914 mb/s memcpy_s: ttl: 0.059029 s avr: 0.003689 s spd: 4337 mb/s for loop (dword): ttl: 0.079306 s avr: 0.004957 s spd: 3228 mb/s while loop (dword): ttl: 0.079903 s avr: 0.004994 s spd: 3204 mb/s for loop (byte): ttl: 0.180427 s avr: 0.011277 s spd: 1419 mb/s ----- PGP key <0x1B6A24550F33E44A>
ntldr Ранг: 369.8 (мудрец), 400thx Активность: 0.39↘0 Статус: Участник	Создано: 15 февраля 2010 22:23 · Личное сообщение · #16 Core i5 3.33 ггц Code: mmx_memcpy_asm: ttl: 0.062969 s avr: 0.003936 s spd: 4065 mb/s mmx_memcpy: ttl: 0.064024 s avr: 0.004002 s spd: 3998 mb/s memcpy_huge: ttl: 0.069716 s avr: 0.004357 s spd: 3672 mb/s sse_memcpy_asm: ttl: 0.073209 s avr: 0.004576 s spd: 3497 mb/s sse_memcpy_asm2: ttl: 0.059884 s avr: 0.003743 s spd: 4275 mb/s sse_memcpy: ttl: 0.072950 s avr: 0.004559 s spd: 3509 mb/s sse_memcpy_u: ttl: 0.073025 s avr: 0.004564 s spd: 3506 mb/s movsd: ttl: 0.057289 s avr: 0.003581 s spd: 4469 mb/s RtlCopyMemory: ttl: 0.057495 s avr: 0.003593 s spd: 4453 mb/s memcpy_s: ttl: 0.073291 s avr: 0.004581 s spd: 3493 mb/s for loop (dword): ttl: 0.076445 s avr: 0.004778 s spd: 3349 mb/s while loop (dword): ttl: 0.076604 s avr: 0.004788 s spd: 3342 mb/s for loop (byte): ttl: 0.166142 s avr: 0.010384 s spd: 1541 mb/s ----- PGP key <0x1B6A24550F33E44A>
HiEndsoft Ранг: 237.0 (наставник), 20thx Активность: 0.13↘0 Статус: Участник sysenter	Создано: 15 февраля 2010 22:46 · Поправил: HiEndsoft · Личное сообщение · #17 Проще выложить было относительный тест ф-ций.Ибо тут важна не производительность как таковая, а какую функу на каком проце при каком выравнивании и размере блока использовать рациональнее. for loop, while loop - ни к чему. Чего компами в топике про программирование меряться, если тут не исходников ни полезного кода?!!? В аттаче - графический тест именно различий. c00a_15.02.2010_CRACKLAB.rU.tgz - Memory.exe ----- продавец резиновых утёнков
huckfuck Ранг: 49.6 (посетитель), 9thx Активность: 0.03↘0 Статус: Участник	Создано: 15 февраля 2010 22:49 · Личное сообщение · #18 Athlon X2 4800+ 2,5 ГГц Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.123881 s avr: 0.007743 s spd: 2067 mb/s mmx_memcpy: ttl: 0.154736 s avr: 0.009671 s spd: 1654 mb/s memcpy_huge: ttl: 0.104545 s avr: 0.006534 s spd: 2449 mb/s sse_memcpy_asm: ttl: 0.212759 s avr: 0.013297 s spd: 1203 mb/s sse_memcpy_asm2: ttl: 0.182187 s avr: 0.011387 s spd: 1405 mb/s sse_memcpy: ttl: 0.213720 s avr: 0.013357 s spd: 1198 mb/s sse_memcpy_u: ttl: 0.210739 s avr: 0.013171 s spd: 1215 mb/s movsd: ttl: 0.228034 s avr: 0.014252 s spd: 1123 mb/s RtlCopyMemory: ttl: 0.229127 s avr: 0.014320 s spd: 1117 mb/s memcpy_s: ttl: 0.213097 s avr: 0.013319 s spd: 1201 mb/s for loop (dword): ttl: 0.226343 s avr: 0.014146 s spd: 1131 mb/s while loop (dword): ttl: 0.228481 s avr: 0.014280 s spd: 1120 mb/s for loop (byte): ttl: 0.307510 s avr: 0.019219 s spd: 832 mb/s
TDA Ранг: 8.1 (гость), 3thx Активность: 0=0 Статус: Участник	Создано: 15 февраля 2010 23:22 · Личное сообщение · #19 Intel(R) Celeron(R) CPU 2.80Ghz 2.79ГГц Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.423023 s avr: 0.026439 s spd: 605 mb/s mmx_memcpy: ttl: 0.357691 s avr: 0.022356 s spd: 716 mb/s memcpy_huge: ttl: 0.320527 s avr: 0.020033 s spd: 799 mb/s sse_memcpy_asm: ttl: 0.715894 s avr: 0.044743 s spd: 358 mb/s sse_memcpy_asm2: ttl: 0.362059 s avr: 0.022629 s spd: 707 mb/s sse_memcpy: ttl: 0.714021 s avr: 0.044626 s spd: 359 mb/s sse_memcpy_u: ttl: 0.723509 s avr: 0.045219 s spd: 354 mb/s movsd: ttl: 0.706423 s avr: 0.044151 s spd: 362 mb/s RtlCopyMemory: ttl: 0.704973 s avr: 0.044061 s spd: 363 mb/s memcpy_s: ttl: 0.712855 s avr: 0.044553 s spd: 359 mb/s for loop (dword): ttl: 0.746167 s avr: 0.046635 s spd: 343 mb/s while loop (dword): ttl: 0.724228 s avr: 0.045264 s spd: 353 mb/s for loop (byte): ttl: 1.025399 s avr: 0.064087 s spd: 250 mb/s
s0l Ранг: 60.6 (постоянный), 20thx Активность: 0.07↘0 Статус: Участник	Создано: 16 февраля 2010 00:09 · Личное сообщение · #20 Intel Pentium D-915 2.80GHz Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.123451 s avr: 0.007716 s spd: 2074 mb/s mmx_memcpy: ttl: 0.118758 s avr: 0.007422 s spd: 2156 mb/s memcpy_huge: ttl: 0.116994 s avr: 0.007312 s spd: 2188 mb/s sse_memcpy_asm: ttl: 0.163798 s avr: 0.010237 s spd: 1563 mb/s sse_memcpy_asm2: ttl: 0.114722 s avr: 0.007170 s spd: 2231 mb/s sse_memcpy: ttl: 0.162782 s avr: 0.010174 s spd: 1573 mb/s sse_memcpy_u: ttl: 0.167714 s avr: 0.010482 s spd: 1526 mb/s movsd: ttl: 0.159698 s avr: 0.009981 s spd: 1603 mb/s RtlCopyMemory: ttl: 0.158644 s avr: 0.009915 s spd: 1614 mb/s memcpy_s: ttl: 0.162949 s avr: 0.010184 s spd: 1571 mb/s for loop (dword): ttl: 0.170325 s avr: 0.010645 s spd: 1503 mb/s while loop (dword): ttl: 0.173755 s avr: 0.010860 s spd: 1473 mb/s for loop (byte): ttl: 0.885738 s avr: 0.055359 s spd: 289 mb/s
Lumen Ранг: 111.1 (ветеран) Активность: 0.04↘0 Статус: Участник	Создано: 16 февраля 2010 00:17 · Личное сообщение · #21 AMD Sempron 2400+ (1,66 ГГц) Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 7.498414 s avr: 0.468651 s spd: 34 mb/s mmx_memcpy: ttl: 7.490995 s avr: 0.468187 s spd: 34 mb/s memcpy_huge: ttl: 8.240654 s avr: 0.515041 s spd: 31 mb/s sse_memcpy_asm: ttl: -1.#IND00 s avr: -1.#IND00 s spd: -1 mb/s ERROR!!!! sse_memcpy_asm2: ttl: -1.#IND00 s avr: -1.#IND00 s spd: -1 mb/s ERROR!!!! sse_memcpy: ttl: -1.#IND00 s avr: -1.#IND00 s spd: -1 mb/s ERROR!!!! sse_memcpy_u: ttl: -1.#IND00 s avr: -1.#IND00 s spd: -1 mb/s ERROR!!!! movsd: ttl: 19.463653 s avr: 1.216478 s spd: 13 mb/s RtlCopyMemory: ttl: 19.452523 s avr: 1.215783 s spd: 13 mb/s memcpy_s: ttl: 19.463433 s avr: 1.216465 s spd: 13 mb/s for loop (dword): ttl: 19.476865 s avr: 1.217304 s spd: 13 mb/s while loop (dword): ttl: 19.483633 s avr: 1.217727 s spd: 13 mb/s for loop (byte): ttl: 78.375483 s avr: 4.898468 s spd: 3 mb/s ----- The truth is out of there...
DrGolova Ранг: 199.6 (ветеран), 12thx Активность: 0.1↘0 Статус: Участник www.uinc.ru	Создано: 16 февраля 2010 03:42 · Поправил: DrGolova · Личное сообщение · #22 Intel Core2Duo E6400 (2.13 Ghz) Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.107460 s avr: 0.006716 s spd: 2382 mb/s mmx_memcpy: ttl: 0.108375 s avr: 0.006773 s spd: 2362 mb/s memcpy_huge: ttl: 0.107014 s avr: 0.006688 s spd: 2392 mb/s sse_memcpy_asm: ttl: 0.154240 s avr: 0.009640 s spd: 1660 mb/s sse_memcpy_asm2: ttl: 0.119730 s avr: 0.007483 s spd: 2138 mb/s sse_memcpy: ttl: 0.154792 s avr: 0.009674 s spd: 1654 mb/s sse_memcpy_u: ttl: 0.162193 s avr: 0.010137 s spd: 1578 mb/s movsd: ttl: 0.142173 s avr: 0.008886 s spd: 1801 mb/s RtlCopyMemory: ttl: 0.144590 s avr: 0.009037 s spd: 1771 mb/s memcpy_s: ttl: 0.154964 s avr: 0.009685 s spd: 1652 mb/s for loop (dword): ttl: 0.160239 s avr: 0.010015 s spd: 1598 mb/s while loop (dword): ttl: 0.160614 s avr: 0.010038 s spd: 1594 mb/s for loop (byte): ttl: 0.263947 s avr: 0.016497 s spd: 970 mb/s
DrGolova Ранг: 199.6 (ветеран), 12thx Активность: 0.1↘0 Статус: Участник www.uinc.ru	Создано: 16 февраля 2010 03:46 · Поправил: DrGolova · Личное сообщение · #23 Слишком короткий тест. Нужно минут на 5 чтобы влияние торентов и прочего хлама свести к минимуму. А то почти все результаты тянут на книгу гинесса (ку!)
DrGolova Ранг: 199.6 (ветеран), 12thx Активность: 0.1↘0 Статус: Участник www.uinc.ru	Создано: 16 февраля 2010 04:06 · Личное сообщение · #24 Ога, i5/i7 выходят одинаковыми если множить на чистоту. Но i5 выигрывают по tdp и по цене. так и з0пишем. Кстати никому не нужен старенький c2d со всеми наворотами за 300 евриков с самовывозом?
__ Ранг: 115.1 (ветеран), 3thx Активность: 0.07↘0 Статус: Участник	Создано: 16 февраля 2010 04:33 · Личное сообщение · #25 сравним тест на тест? P.S. тест не мой 28f0_15.02.2010_CRACKLAB.rU.tgz - memcopy2.exe
s0l Ранг: 60.6 (постоянный), 20thx Активность: 0.07↘0 Статус: Участник	Создано: 16 февраля 2010 05:41 · Поправил: s0l · Личное сообщение · #26 Со второго теста:
Rustem Ранг: 74.1 (постоянный), 34thx Активность: 0.03↘0 Статус: Участник	Создано: 16 февраля 2010 08:18 · Личное сообщение · #27 со второго
Lacoste Ранг: 6.8 (гость) Активность: 0.01↘0 Статус: Участник	Создано: 16 февраля 2010 08:49 · Личное сообщение · #28 Pentium Dual Core E5200 (2.5GHz) Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.125253 s avr: 0.007828 s spd: 2044 mb/s mmx_memcpy: ttl: 0.124655 s avr: 0.007791 s spd: 2054 mb/s memcpy_huge: ttl: 0.121486 s avr: 0.007593 s spd: 2107 mb/s sse_memcpy_asm: ttl: 0.184123 s avr: 0.011508 s spd: 1390 mb/s sse_memcpy_asm2: ttl: 0.138457 s avr: 0.008654 s spd: 1849 mb/s sse_memcpy: ttl: 0.187400 s avr: 0.011713 s spd: 1366 mb/s sse_memcpy_u: ttl: 0.189379 s avr: 0.011836 s spd: 1352 mb/s movsd: ttl: 0.176124 s avr: 0.011008 s spd: 1454 mb/s RtlCopyMemory: ttl: 0.176846 s avr: 0.011053 s spd: 1448 mb/s memcpy_s: ttl: 0.183867 s avr: 0.011492 s spd: 1392 mb/s for loop (dword): ttl: 0.194985 s avr: 0.012187 s spd: 1313 mb/s while loop (dword): ttl: 0.189173 s avr: 0.011823 s spd: 1353 mb/s for loop (byte): ttl: 0.241433 s avr: 0.015090 s spd: 1060 mb/s
s0cpy Ранг: 146.7 (ветеран), 1thx Активность: 0.07↘0 Статус: Участник	Создано: 16 февраля 2010 09:43 · Личное сообщение · #29 Core i7 920 OC 4Ghz Code: buffer size = 16777216 Bytes number of copy operation = 16 preparing... start! mmx_memcpy_asm: ttl: 0.034625 s avr: 0.002164 s spd: 7394 mb/s mmx_memcpy: ttl: 0.034272 s avr: 0.002142 s spd: 7470 mb/s memcpy_huge: ttl: 0.038031 s avr: 0.002377 s spd: 6731 mb/s sse_memcpy_asm: ttl: 0.046487 s avr: 0.002905 s spd: 5507 mb/s sse_memcpy_asm2: ttl: 0.033138 s avr: 0.002071 s spd: 7725 mb/s sse_memcpy: ttl: 0.046550 s avr: 0.002909 s spd: 5499 mb/s sse_memcpy_u: ttl: 0.047051 s avr: 0.002941 s spd: 5441 mb/s movsd: ttl: 0.039692 s avr: 0.002481 s spd: 6450 mb/s RtlCopyMemory: ttl: 0.039815 s avr: 0.002488 s spd: 6430 mb/s memcpy_s: ttl: 0.046546 s avr: 0.002909 s spd: 5500 mb/s for loop (dword): ttl: 0.060943 s avr: 0.003809 s spd: 4201 mb/s while loop (dword): ttl: 0.061031 s avr: 0.003814 s spd: 4195 mb/s for loop (byte): ttl: 0.139331 s avr: 0.008708 s spd: 1837 mb/s
Vol4ok Ранг: 47.1 (посетитель), 2thx Активность: 0.03↘0 Статус: Участник	Создано: 16 февраля 2010 11:24 · Личное сообщение · #30 На сколько я понял, второй тест измеряет время при помощи rdtsc - что менее точно чем QueryPerfomanceCounter, изза этого результаты различаются, но тенденция остается таже.

. 1 . 2 . >>

Для печати