April 2015 Issue
At Deloitte we’re redesigning our performance management system. This may not surprise you. Like many other companies, we realize that our current process for evaluating the work of our people—and then training them, promoting them, and paying them accordingly—is increasingly out of step with our objectives.
In a public survey Deloitte conducted recently, more than half the executives questioned (58%) believe that their current performance management approach drives neither employee engagement nor high performance. They, and we, are in need of something nimbler, real-time, and more individualized—something squarely focused on fueling performance in the future rather than assessing it in the past.
What might surprise you, however, is what we’ll include in Deloitte’s new system and what we won’t. It will have no cascading objectives, no once-a-year reviews, and no 360-degree-feedback tools. We’ve arrived at a very different and much simpler design for managing people’s performance. Its hallmarks are speed, agility, one-size-fits-one, and constant learning, and it’s underpinned by a new way of collecting reliable performance data. This system will make much more sense for our talent-dependent business. But we might never have arrived at its design without drawing on three pieces of evidence: a simple counting of hours, a review of research in the science of ratings, and a carefully controlled study of our own organization.
Counting and the Case for Change
More than likely, the performance management system Deloitte has been using has some characteristics in common with yours. Objectives are set for each of our 65,000-plus people at the beginning of the year; after a project is finished, each person’s manager rates him or her on how well those objectives were met. The manager also comments on where the person did or didn’t excel. These evaluations are factored into a single year-end rating, arrived at in lengthy “consensus meetings” at which groups of “counselors” discuss hundreds of people in light of their peers.
Internal feedback demonstrates that our people like the predictability of this process and the fact that because each person is assigned a counselor, he or she has a representative at the consensus meetings. The vast majority of our people believe the process is fair. We realize, however, that it’s no longer the best design for Deloitte’s emerging needs: Once-a-year goals are too “batched” for a real-time world, and conversations about year-end ratings are generally less valuable than conversations conducted in the moment about actual performance.
But the need for change didn’t crystallize until we decided to count things. Specifically, we tallied the number of hours the organization was spending on performance management—and found that completing the forms, holding the meetings, and creating the ratings consumed close to 2 million hours a year. As we studied how those hours were spent, we realized that many of them were eaten up by leaders’ discussions behind closed doors about the outcomes of the process. We wondered if we could somehow shift our investment of time from talking to ourselves about ratings to talking to our people about their performance and careers—from a focus on the past to a focus on the future.
The Science of Ratings
Our next discovery was that assessing someone’s skills produces inconsistent data. Objective as I may try to be in evaluating you on, say, strategic thinking, it turns out that how much strategic thinking I do, or how valuable I think strategic thinking is, or how tough a rater I am significantly affects my assessment of your strategic thinking.
How significantly? The most comprehensive research on what ratings actually measure was conducted by Michael Mount, Steven Scullen, and Maynard Goff and published in the Journal of Applied Psychology in 2000. Their study—in which 4,492 managers were rated on certain performance dimensions by two bosses, two peers, and two subordinates—revealed that 62% of the variance in the ratings could be accounted for by individual raters’ peculiarities of perception. Actual performance accounted for only 21% of the variance. This led the researchers to conclude (in How People Evaluate Others in Organizations, edited by Manuel London): “Although it is implicitly assumed that the ratings measure the performance of the ratee, most of what is being measured by the ratings is the unique rating tendencies of the rater. Thus ratings reveal more about the rater than they do about the ratee.” This gave us pause. We wanted to understand performance at the individual level, and we knew that the person in the best position to judge it was the immediate team leader. But how could we capture a team leader’s view of performance without running afoul of what the researchers termed “idiosyncratic rater effects”?
Putting Ourselves Under the Microscope
We also learned that the defining characteristic of the very best teams at Deloitte is that they are strengths oriented. Their members feel that they are called upon to do their best work every day. This discovery was not based on intuitive judgment or gleaned from anecdotes and hearsay; rather, it was derived from an empirical study of our own high-performing teams.
Our study built on previous research. Starting in the late 1990s, Gallup conducted a multiyear examination of high-performing teams that eventually involved more than 1.4 million employees, 50,000 teams, and 192 organizations. Gallup asked both high- and lower-performing teams questions on numerous subjects, from mission and purpose to pay and career opportunities, and isolated the questions on which the high-performing teams strongly agreed and the rest did not. It found at the beginning of the study that almost all the variation between high- and lower-performing teams was explained by a very small group of items. The most powerful one proved to be “At work, I have the opportunity to do what I do best every day.” Business units whose employees chose “strongly agree” for this item were 44% more likely to earn high customer satisfaction scores, 50% more likely to have low employee turnover, and 38% more likely to be productive.
-
Di Deloitte kami merancang ulang sistem manajemen kinerja kami. Ini mungkin tidak mengejutkan Anda. Seperti banyak perusahaan lain, kami menyadari bahwa proses kami saat ini untuk mengevaluasi pekerjaan karyawan kami — dan kemudian melatih mereka, mempromosikan mereka, dan membayar mereka sesuai itu — semakin tidak sesuai dengan tujuan kami.
Dalam survei publik yang dilakukan Deloitte baru-baru ini, lebih dari setengah eksekutif yang ditanyai (58%) percaya bahwa pendekatan manajemen kinerja mereka saat ini tidak mendorong keterlibatan karyawan maupun kinerja tinggi. Mereka, dan kami, membutuhkan sesuatu yang lebih gesit, real-time, dan lebih individual — sesuatu yang benar-benar terfokus pada peningkatan kinerja di masa depan daripada menilai di masa lalu.
Namun, yang mungkin mengejutkan Anda adalah apa yang akan kami sertakan dalam sistem baru Deloitte dan apa yang tidak akan kami dapatkan. Ini tidak akan memiliki tujuan berjenjang, tidak ada ulasan sekali setahun, dan tidak ada alat umpan balik 360 derajat. Kami tiba di desain yang sangat berbeda dan jauh lebih sederhana untuk mengelola kinerja orang. Keunggulannya adalah kecepatan, kelincahan, satu ukuran cocok, dan pembelajaran konstan, dan didukung oleh cara baru mengumpulkan data kinerja yang andal. Sistem ini akan jauh lebih masuk akal untuk bisnis yang bergantung pada bakat kita. Tetapi kita mungkin tidak akan pernah sampai pada desainnya tanpa menggambar pada tiga lembar bukti: penghitungan sederhana jam, tinjauan penelitian dalam ilmu penilaian, dan studi yang dikendalikan dengan cermat dari organisasi kita sendiri.
Counting and the Case for Change
Kemungkinan besar, sistem manajemen kinerja yang digunakan Deloitte memiliki beberapa karakteristik yang sama dengan Anda. Tujuan ditetapkan untuk masing-masing dari 65.000 orang kami pada awal tahun; setelah proyek selesai, manajer masing-masing orang menilai dia tentang seberapa baik tujuan-tujuan tersebut tercapai. Manajer juga mengomentari di mana orang itu melakukan atau tidak unggul. Evaluasi-evaluasi ini diperhitungkan dalam satu peringkat akhir tahun, tiba pada “pertemuan konsensus” yang panjang di mana kelompok-kelompok “penasihat” mendiskusikan ratusan orang dengan mempertimbangkan rekan-rekan mereka.
Umpan balik internal menunjukkan bahwa orang-orang kami menyukai prediksi proses ini dan fakta bahwa karena setiap orang ditugaskan sebagai penasihat, ia memiliki perwakilan di rapat konsensus. Sebagian besar orang kami percaya prosesnya adil. Kami menyadari, bagaimanapun, bahwa itu bukan lagi desain terbaik untuk kebutuhan Deloitte yang sedang muncul: tujuan setahun sekali terlalu "padat" untuk dunia waktu-nyata, dan percakapan tentang peringkat akhir tahun umumnya kurang bernilai daripada percakapan yang dilakukan di momen tentang kinerja aktual.
Tetapi kebutuhan untuk perubahan tidak mengkristal sampai kami memutuskan untuk menghitung hal-hal. Secara khusus, kami menghitung jumlah jam yang dihabiskan organisasi untuk manajemen kinerja — dan menemukan bahwa mengisi formulir, mengadakan rapat, dan membuat peringkat yang dikonsumsi hampir 2 juta jam setahun. Ketika kami mempelajari bagaimana jam-jam itu dihabiskan, kami menyadari bahwa banyak dari mereka yang dimakan oleh diskusi para pemimpin di balik pintu tertutup tentang hasil dari proses tersebut. Kami bertanya-tanya apakah kami dapat mengalihkan investasi waktu dari berbicara kepada diri sendiri tentang peringkat menjadi berbicara dengan karyawan tentang kinerja dan karier mereka — dari fokus di masa lalu ke fokus di masa depan.
The Science of Ratings
Penemuan kami berikutnya adalah bahwa menilai keterampilan seseorang menghasilkan data yang tidak konsisten. Walaupun saya mungkin mencoba untuk mengevaluasi Anda tentang, katakanlah, pemikiran strategis, ternyata seberapa banyak pemikiran strategis yang saya lakukan, atau betapa berharganya pemikiran strategis saya, atau seberapa tangguh seorang penilai, saya secara signifikan memengaruhi penilaian saya terhadap Anda. pemikiran strategis.
Seberapa signifikan? Penelitian paling komprehensif tentang apa yang sebenarnya diukur oleh peringkat dilakukan oleh Michael Mount, Steven Scullen, dan Maynard Goff dan diterbitkan dalam Journal of Applied Psychology pada tahun 2000. Studi mereka — di mana 4.492 manajer dinilai pada dimensi kinerja tertentu oleh dua bos, dua teman sebaya, dan dua bawahan — mengungkapkan bahwa 62% varian dalam peringkat dapat dipertanggungjawabkan oleh kekhasan persepsi penilai individu. Kinerja aktual hanya menyumbang 21% dari varians. Hal ini mengarahkan para peneliti untuk menyimpulkan (dalam Bagaimana Orang Mengevaluasi Orang Lain dalam Organisasi, diedit oleh Manuel London): “Meskipun secara implisit diasumsikan bahwa peringkat mengukur kinerja ratee, sebagian besar yang diukur dengan peringkat adalah peringkat unik kecenderungan penilai. Dengan demikian peringkat mengungkapkan lebih banyak tentang penilai daripada yang dilakukan pada ratee. ”Ini memberi kami jeda. Kami ingin memahami kinerja di tingkat individu, dan kami tahu bahwa orang yang berada di posisi terbaik untuk menilai itu adalah pemimpin tim langsung. Tetapi bagaimana kita bisa menangkap pandangan pemimpin tim tentang kinerja tanpa melanggar apa yang disebut oleh peneliti sebagai "efek rater istimewa"?
Putting Ourselves Under the Microscope
Kami juga belajar bahwa ciri khas dari tim terbaik di Deloitte adalah bahwa mereka berorientasi pada kekuatan. Anggota mereka merasa bahwa mereka dipanggil untuk melakukan pekerjaan terbaik mereka setiap hari. Penemuan ini tidak didasarkan pada penilaian intuitif atau diperoleh dari anekdot dan desas-desus; melainkan berasal dari studi empiris tim kami yang berkinerja tinggi.
Studi kami dibangun berdasarkan penelitian sebelumnya. Dimulai pada akhir 1990-an, Gallup melakukan pemeriksaan multi-tahun dari tim berkinerja tinggi yang akhirnya melibatkan lebih dari 1,4 juta karyawan, 50.000 tim, dan 192 organisasi. Gallup mengajukan pertanyaan kepada tim yang berkinerja tinggi dan yang lebih rendah pada banyak subjek, dari misi dan tujuan untuk membayar dan peluang karir, dan mengisolasi pertanyaan-pertanyaan di mana tim berkinerja tinggi sangat setuju dan sisanya tidak. Ditemukan di awal penelitian bahwa hampir semua variasi antara tim berkinerja tinggi dan rendah dijelaskan oleh sekelompok item yang sangat kecil. Yang paling kuat terbukti sebagai "Di tempat kerja, saya memiliki kesempatan untuk melakukan yang terbaik yang saya lakukan setiap hari." Unit bisnis yang karyawannya memilih "sangat setuju" untuk item ini adalah 44% lebih mungkin untuk mendapatkan skor kepuasan pelanggan yang tinggi, 50 % lebih cenderung memiliki tingkat pergantian karyawan yang rendah, dan 38% lebih cenderung produktif.
https://hbr.org/2015/04/reinventing-performance-management
https://trainingindustry.com/articles/workforce-development/reinventing-performance-management/