Título: Cache line reservation: exploring a scheme for cache-friendly object allocation
Autores: Bilicki, Ivan
Fecha: 2009
Publicador: McGill University - MCGILL
Fuente:
Tipo: Electronic Thesis or Dissertation
Tema: Applied Sciences - Computer Science
Descripción: This thesis presents a novel idea for object allocation, cache line reservation (CLR), whose goal is to reduce data cache misses. Certain objects are allocated from "reserved" cache lines, so that they do not evict other objects that will be needed later. We discuss what kinds of allocations can benefit from CLR, as well as sources of overhead. Prototypes using CLR were implemented in the IBM® J9 Java™ virtual machine (JVM) and its Testarossa just-in-time (JIT) compiler. A performance study of our prototypes was conducted using various benchmarks. CLR can offer a benefit in specialized microbenchmarks when allocating long-lived objects that are accessed in infrequent bursts. In other benchmarks such as SPECjbb2005 and SPECjvm2008, we show that CLR can reduce cache misses when allocating a large number of short-lived objects, but not provide a performance improvement due to the introduced overhead. We measure and quantify this overhead in the current implementation and suggest areas for future development. CLR is not limited to Java applications, so other static and dynamic compilers could benefit from it in the future.
Cette thèse présente une nouvelle idée pour l'attribution d'objet, réservation de ligne d'antémémoire (RLA), dont le but est de réduire les échecs d'accès à l'antémémoire. Certains objets sont alloués à partir d'une antémémoire de réserve, de manière à éviter l'éviction d'autres objets ultérieurement requis. Nous discutons les types d'allocation qui peuvent bénéficier de RLA, ainsi que les sources de coûts indirects. Les prototypes que nous avons développé qui font usage de RLA furent créés utilisant la machine virtuelle IBM® J9 Java™ et son compilateur juste-a-temps Testarossa. Une étude de performance de nos prototypes fut conduite avec plusieurs tests de performance. RLA peut offrir un bénéfice pour des microtests de performance spécialisés dans les cas où des objets de longue vie sont lus en rafales infréquentes. Dans d'autres tests que SPECjbb2005 et SPECjvm2008, nous démontrons que RLA peut réduire les échecs d'accès a l'antémémoire dans les cas d'allocation d'un grand nombre d'objets de court temps de vie, mais n'offre pas d'amélioration de la performance vue l'introduction de coûts indirects. Nous mesurons et quantifions ces coûts dans notre implémentation courante et suggérons des domaines de développement futurs. RLA n'est pas limité aux applications Java, ce qui permet à d'autres compilateurs statiques comme dynamiques d'en tirer profit dans l'avenir.
Idioma: en