Changes between Version 3 and Version 4 of LibCSSE


Ignore:
Timestamp:
May 22, 2014, 4:33:19 PM (12 years ago)
Author:
john
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • LibCSSE

    v3 v4  
    1515}}}
    1616
    17 ||= Idea                          =||= Westmere      =||= Sandy Bridge  =||= Ivy Bridge    =||= Penryn    = ||
     17||= Idea                          =||= Westmere      =||= Sandy Bridge  =||= Ivy Bridge    =||= Penryn     =||
    1818|| Replace `dec` with `sub`        || none            || none            || none            ||              ||
    1919|| Use movsd instead of movsq      || slightly slower || slightly slower || 6% faster       ||              ||
     
    3535Now testing the overlap case:
    3636
    37 ||= Idea                          =||= Westmere      =||= Sandy Bridge  =||= Ivy Bridge    =||= Penryn    = ||
     37||= Idea                          =||= Westmere      =||= Sandy Bridge  =||= Ivy Bridge    =||= Penryn     =||
    3838|| `movaps` 64 at a time           || 56% faster      || 56% faster      || 56% faster      || 48% faster   ||
    3939|| Above using leaq                || 50% faster      || 56% faster      || 60% faster      || 52% faster   ||