<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Apr 29, 2014 at 1:14 PM, Sam Williams <span dir="ltr"><<a href="mailto:swwilliams@lbl.gov" target="_blank">swwilliams@lbl.gov</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">optimized = simd intrinsics, array padding to avoid cache aliasing cognizant of line size, associativity, cache size, replacing omp workshare with static parallel regions and manually fusing operations/communication together, etc...<br>


<br>
I think you can have a couple reference implementations...<br>
- C with MPI and/or OpenMP (so you can run on distributed memory machines or SGI UV ccNUMA)<br>
- CUDA with MPI (little hesitant on this given there is either a new version or new release candidate of CUDA every 6 months)<br>
<br>
The kiviats were constructed with code as is.  </blockquote><div><br></div><div>What is "as is".  Many of these apps were LLNL apps that have been running on BG for years.  They are certainly optimized for it.  All apps are optimized to some degree or they would not qualify as an app.</div>

<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">HPCG defenders promise better performance with optimization.<br>
Showing HPGMG optimized performance and performance characteristics looks better than vanilla code/HPCG doesn't address the argument.  It only says optimization is beneficial.<br>
<br></blockquote><div><br></div><div>I hate to try to define "optimized".  I don't think we have the resources to adjudicate this and it will just piss people off and cause debate (like this) that is not useful as far as I can see.</div>

</div><br></div></div>