top of page

qlucore heatmap

/span>Kata Pengantar Segala puji syukur hanya kepada Tuhan yang telah memberi rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan buku ini dengan judul Coorelation Matrix Heatmap . Buku ini disusun guna untuk melengkapi tugas mata kuliah Softskill Desain Pemodelan grak, Program Studi Teknik Informatika, Fakultas Teknologi Industri, Universitas Gunadarma. Di mana dalam proses pembuatannya menemui banyak kendala yang tanpa bantuan dari berbagai pihak tentu saja buku ini tidak dapat terselesaikan. Terima kasih disampaikan kepada Bapak Dr. rer. nat. I Made Wiryana, SKom, SSi, MAppSc selaku dosen pembimbing softskill. Terimakasih juga disampaikan kepada kelas 3 IA15 atas kontribusi dalam penyempurnaan buku ini. Terimakasih kepada kelompok 8 softskill kelas 3IA15 yang telah berkontribusi dalam editing dan semua pihak yang telah ikut membantu dalam penyelesaian buku ini. Penulis menyadari sepenuhnya bahwa dalam penyusunan buku ini masih terdapat banyak kekurangan, untuk itu penulis mengharap kritik dan saran dari berbagai pihak untuk sempurnanya sebuah buku ini. Selain itu penulis juga berharap semoga buku ini dapat memberikan manfaat bagi kita semua. Depok, 1 Februari 2016 Kelas 3 IA 15 Kelompok 8 1 2 DAFTAR ISI Contents 1 Pendahuluan 6 1.1 Latar Belakang . . . . . . . . . . . 6 1.2 Rumusan Masalah . . . . . . . . . 6 1.3 Tujuan Penulisan . . . . . . . . . 6 2 Landasan Teori 7 2.1 Denisi Heatmap . . . . . . . . . 7 2.2 Sejarah Heatmap . . . . . . . . . 7 2.3 Tipe Heatmap . . . . . . . . . . . 9 2.4 Skema Warna . . . . . . . . . . . 11 2.5 Cluster Heatmap . . . . . . . . . . 14 2.5.1 Shading Matriks . . . . . . 17 2.5.2 Permuting Matriks . . . . . 17 3 Aplikasi pendukung Heatmap 25 3.1 Qlucore Omics Explorer . . . . . . 25 3.1.1 Apa itu Qlucore Omics Explorer? . . . . . . . . . . . 25 3.1.2 Tutorial menggunakan Qlucore Omics Explorer (QOE) 25 3.1.3 Analisis statistik dengan Visual Feedback . . . . . . . 31 3 3.1.4 Menggunakan Jaringan dan Grak . . . . . . . . . . . 33 3.1.5 Modifying annotations . . 33 3.1.6 Multiple Plot Windows . . 35 3.1.7 Mengerjakan dengan Variabel . . . . . . . . . . . . . 35 3.1.8 Membuat Penggolongan . . 39 3.1.9 Analisis lebih lanjut dan eksplorasi . . . . . . . . . . . 39 3.1.10 Mengekspor gambar, animasi dan data lainnya . . . . . . 45 4 Kasus pemanfaatan pada Qlucore Omics Explorer 47 4.1 Uji Hipotesis . . . . . . . . . . . 47 4.1.1 Apa itu Hipotesis? . . . . . 47 4.1.2 Apa itu nilai P? . . . . . . 47 4.1.3 Apa itu nilai Q? . . . . . . 48 4.1.4 Haruskah saya gunakan uji satu sisi atau dua sisi? . . . 50 4.1.5 Data set eksplorasi . . . . . 56 4.1.6 Apa yang dimaksud dengan t-test dan Kapan saya harus menggunakannya? . . . . . 60 4 4.1.7 Memanfaatkan informasi biologi System (GSEA dan GO) 61 4.1.8 GO Browser . . . . . . . . 65 4.1.9 Apa itu ANOVA dan Kapan saya harus menggunakannya? . . . . . . . . . . . . 72 4.1.10 Kapan harus menggunakan Penyaringan Varian? . . . . 72 4.2 PCA plots . . . . . . . . . . . . . 74 4.3 Apa arti penting dari statistik plot PCA. . . . . . . . . . . . . . . . 74 4.3.1 Bisakah PCA melewatkan struktur dan pola? . . . . . 75 5 Penutup 76 5.1 Kesimpulan . . . . . . . . . . . . 76 5.2 Saran . . . . . . . . . . . . . . . . 76 February 1, 2016 5 Bab 1 1 Pendahuluan 1.1 Latar Belakang Buku ini adalah buku yang membahas tentang korelasi matriks heatmap, buku ini penulis dedikasikan untuk memberikan sebuah penyampaian materi yang berbeda, dari materi buku  buku lainnya. Tujuan dari heatmap matriks korelasi adalah sebuah peta yang menggambarkan persebaran lokasi dan frekuensi data dalam dengan pewarnaan. Sedangkan yang lebih dibahas dalam buku ini adalah lebih mengerucut tentang korelasi matriks heatmap. Matriks korelasi adalah suatu matriks yang di dalamnya terdapat korelasi  korelasi. korelasi addalah study yang membahas tentang drajat hubungan antara dua variable atau lebih. Korelasi merupakan salah satu teknik statistika yang banyak digunakan oleh peneliti umumnya tertarik terhadap pristtiwapristiwa yang terjadi dan mencoba menghubungkanya Heatmap adalah Sebuah peta panas adalah representasi gras dari data di mana nilai-nilai individu yang terkandung dalam matriks yang direpresentasikan sebagai warna . 1.2 Rumusan Masalah Buku ini disusun dengan tujuan : 1. Memahami bagaimana konsep dasar heatmap 2. Menambah pengetahuan mengenai heat map 3. Memahami penggunaan software yang digunakan 4. Sebagai tugas kelompok mata kuliah softskill 1.3 Tujuan Penulisan 1. Bagaimana konsep dasar heatmap? 2. Apa saja yang ada dalam heatmap? 3. Bagaimana menggunakan aplikasi Qlucore Omics Explorer ? 6 Bab 2 2 Landasan Teori 2.1 Denisi Heatmap Apa itu heatmap? Heatmap adalah sebuah peta yang menggambarkan persebaran lokasi dan frekuensi data dalam dengan pewarnaan. Heatmap adalah representasi gras dari data di mana nilainilai individu yang terkandung dalam matriks yang direpresentasikan sebagai warna. Peta fraktal dan peta pohon baik sering menggunakan sistem serupa warna-coding untuk mewakili nilai-nilai yang diambil oleh variabel dalam hirarki. Istilah ini juga digunakan untuk berarti aplikasi tematik sebagai peta choropleth. 2.2 Sejarah Heatmap Istilah "Heatmap" pada awalnya diciptakan dan merek dagang oleh software desainer Cormac Kinney pada tahun 1991, untuk menggambarkan tampilan 2D menggambarkan real time informasi pasar keuangan. Heatmap berasal menampilkan 2D dari nilai-nilai dalam matriks data. nilai yang lebih besar diwakili oleh kotak kecil abu-abu gelap atau hitam (piksel) dan nilai-nilai yang lebih kecil dengan kotak ringan. Sneath (1957) ditampilkan hasil analisis cluster dengan permutasi baris dan kolom dari matriks untuk menempatkan nilai yang sama dekat satu sama lain sesuai dengan clustering. Jacques Bertin digunakan representasi yang sama untuk menampilkan data yang sesuai untuk skala Guttman. Ide untuk bergabung pohon cluster untuk baris dan kolom dari matriks data yang berasal Robert Ling pada tahun 1973. Ling digunakan karakter printer telak untuk mewakili berbagai nuansa abu-abu, satu karakter-lebar per pixel. Leland Wilkinson mengembangkan program komputer pertama pada tahun 1994 (SYSTAT) untuk menghasilkan peta panas cluster dengan gras warna resolusi tinggi. The Eisen et al. display yang ditunjukkan pada gambar adalah replikasi dari sebelumnya SYSTAT desain. Pada tahun 1993, dengan Carnegie Mellon Senior Research Scientist, Marc H. Graham, Kinney didirikan NeoVision Hypersystems, Inc. untuk mengembangkan dan memasarkan teknologi heatmaps. NeoVision heatmaps adalah waktu middleware nyata dan platform komputasi dengan antarmuka visual warna-warni sekarang-akrab. Dengan platform heatmaps, perdagangan khusus, manajemen risiko dan broker pemantauan aplikasi yang dibangun, mengkonsolidasikan sejumlah besar real time dan data statis. Setelah lisensi teknologi untuk meja perdagangan di Merrill Lynch, Citibank, Salomon Brothers dan Morgan Stanley, dan 9 departemen di Deutsche Bank, ia mengangkat total $ 8 juta dari Deutsche Bank, Bear Stearns, Intel Corporation dan investor modal ventura. Dengan modal segar, Kinney disewa Brian Barefoot, Presiden PaineWebber 7 International, dan kepala sebelumnya global penjualan dan perdagangan di Merrill Lynch sebagai CEO, menambahkan Deutsche Bank Global COO ke papan NeoVision ini, dan terus memperluas peluncuran heatmaps banyak buy besar dan menjual lembaga keuangan sisi, termasuk Bank of America, PaineWebber, Bear Stearns, Merrill Lynch, Smith Barney dan 13 broker lainnya, JPMorgan Chase, Fidelity dan DTC , untuk memantau sampai $ 1,7 triliun pada transaksi harian. Setelah NeoVision, Barefoot menjadi Presiden Babson College selama tujuh tahun. lisensi distribusi yang signikan dibuat dengan Bloomberg LP, Dow Jones Telerate, Thomson, dan Reuters untuk lisensi heatmaps ke lebih dari 300.000 desktop. The Nasdaq adalah yang pertama untuk lisensi versi web, webHeatmaps, yang telah disertakan pada halaman depan www.nasdaq.com sejak tahun 2001 sampai 2013, dengan sekitar 2,4 juta tampilan halaman setiap hari. Pada tahun 2002, ia merancang biaya perdagangan sistem analisis untuk Fidelity Investments - dikutip oleh The Wall Street Journal sebagai "sistem pelacakan canggih untuk melihat mana broker dapat melakukan perdagangan yang paling esien," yang dikreditkan, sebagian, dengan mengurangi reksadana biaya perdagangan perusahaan dengan ratusan juta dolar per tahun, setengah ratarata industri. Sistem ini, Brokermaps, kemudian dipasang di Bank of America Manajemen Investasi, Invesco, Janus, Merrill Lynch Investment Management dan Putnam Investments. Pada Juli 2013, sejak tahun 1993, heatmaps telah dikutip di lebih dari 350 paten yang diberikan oleh PTO AS, dan di puluhan peer review makalah penelitian. Setelah direncanakan IPO $ 30.000.000 jatuh karena com kecelakaan dot, NeoVision diakuisisi pada tahun 2003 oleh software keuangan konglomerat SS & C Technologies. Hari ini teknologi NeoVision dimasukkan ke dalam beberapa SS & C produk. 8 Figure 1: Heat map telah digunakan untuk menampilkan area dari halaman web yang paling sering dipindai oleh pengunjung. Heatmaps web yang sering digunakan bersama bentuk-bentuk lain dari analisis web dan alat sesi replay. 2.3 Tipe Heatmap Ada berbagai jenis heatmap: • Heat map telah digunakan untuk menampilkan area dari halaman web yang paling sering dipindai oleh pengunjung. Heatmaps web yang sering digunakan bersama bentuk-bentuk lain dari analisis web dan alat sesi replay. • Peta biologi panas biasanya digunakan dalam biologi molekuler untuk mewakili tingkat ekspresi banyak gen di sejumlah sampel sebanding (misalnya sel di negara-negara yang berbeda, sampel dari pasien yang berbeda) karena mereka diperoleh dari DNA microarray. • Tree map adalah partisi hirarkis 2D dari data yang secara visual menyerupai peta panas. • Sebuah plot mosaik adalah heatmap untuk mewakili dua arah atau lebih dataran tinggi-cara tabel data. Seperti treemaps, daerah persegi panjang 9 Figure 2: Peta biologi panas biasanya digunakan dalam biologi molekuler untuk mewakili tingkat ekspresi banyak gen di sejumlah sampel sebanding (misalnya sel di negara-negara yang berbeda, sampel dari pasien yang berbeda) karena mereka diperoleh dari DNA microarray. 10 Figure 3: Tree map adalah partisi hirarkis 2D dari data yang secara visual menyerupai peta panas. dalam plot mosaik yang hirarki terorganisir. Sarana bahwa daerah yang persegi panjang bukannya kotak. Friendly (1994) survei sejarah dan penggunaan grak ini. 2.4 Skema Warna Ada banyak skema warna yang berbeda yang dapat digunakan untuk menggambarkan heatmap, dengan keuntungan persepsi dan kerugian untuk setiap. Rainbow colormaps sering digunakan, agar manusia dapat merasakan nuansa lebih warna dari yang mereka dapat dari abu-abu, dan ini nantinya akan meningkatkan jumlah detail dipahami dalam gambar. Namun, ini tidak disarankan oleh banyak dalam komunitas ilmiah, dengan alasan sebagai berikut: 1. Warna kekurangan memesan persepsi alami yang ditemukan dalam grayscale atau hitam colormaps spektrum. 2. Colormaps umum (seperti "jet" colormap digunakan sebagai default di banyak paket perangkat lunak visualisasi) memiliki perubahan yang tidak terkendali di luminance yang mencegah konversi berarti untuk grayscale untuk tampilan atau pencetakan. Ini juga mengalihkan perhatian daridata aktual, sewenang-wenang membuat daerah kuning dan cyan tampillebih menonjol dari pada daerah data yang sebenarnya paling penting.3. Perubahan antara warna juga menyebabkan persepsi gradien yang tidakbenar-benar hadir, membuat gradien yang sebenarnya kurang menonjol,11Figure 4:Sebuah plot mosaik adalah heatmap untuk mewakili dua arah atau lebih datarantinggi-cara tabel data. Seperti treemaps, daerah persegi panjang dalam plotmosaik yang hirarki terorganisir. Sarana bahwa daerah yang persegi panjangbukannya kotak. Friendly (1994) survei sejarah dan penggunaan grak ini.12yang berarti bahwa colormaps pelangi dapat rinci sebenarnya jelas dalambanyak kasus daripada meningkatkan itu.132.5 Cluster HeatmapCluster Heatmap atau Peta klaster panas adalah kotak atau persegipanjang dari matriks data dengan pohon klaster ditambahkan kemargin-nya. Dalam area tampilan yang relatif kompak, memfasilitasipemeriksaan baris, kolom, dan struktur cluster bersama. Matriksdata yang cukup besar (beberapa ribu baris / kolom) dapat ditampilkan secara efektif pada warna monitor resolusi tinggi dan matriks yang lebih besar dapat ditangani di media cetak atau di displaymegapiksel.Peta klaster panas terkenal dalam ilmu alam dan salah satu grakyang paling banyak digunakan dalam ilmu biologi. Sebagai Weinstein(2008) menyebutkan:• Untuk visualisasi, sejauh ini representasi gras yang paling populer telahheatmap berkerumun, yang compacts sejumlah besar informasi ke dalamsebuah ruang kecil untuk membawa keluar pola yang koheren dalam data.... Sejak debut mereka lebih dari 10 tahun yang lalu, peta berkerumunpanas telah muncul di lebih dari 4000 publikasi biologis atau biomedis.Weinstein menggambarkan peta panas sebagai berikut:• Dalam kasus ekspresi gen data, warna ditugaskan ke titik di peta panasjaringan menunjukkan berapa banyak dari RNA tertentu atau proteindinyatakan dalam sampel yang diberikan. Ekspresi gen Tingkat umumnyaditandai dengan warna merah untuk ekspresi tinggi dan baik hijau ataubiru untuk ekspresi yang rendah. Pola koheren (patch) dari warna yangdihasilkan oleh pengelompokan hirarki pada kedua horisontal dan vertikalsumbu untuk membawa seperti bersama-sama dengan seperti. HubunganCluster ditandai dengan pohon-seperti struktur berdekatan dengan petapanas, dan patch warna dapat menunjukkan hubungan fungsional antaragen dan sampel.Gambar 1 menunjukkan peta panas khas seperti yang dijelaskan olehWeinstein. Yang paling populer bioinformatika perangkat lunak untuk memproduksi gras ini didokumentasikan dalam Eisen et al. (1998).The Eisen kertas, yang menggambarkan sebuah cluster panas petaProgram, adalah artikel yang paling dikutip ketiga di PNAS padatanggal 1 Juli, 2008 (PNAS 2008). The "Debut" Weinstein mengacu mungkin adalah debut dalam literatur biologi, tapi jelas tidakdebut dalam literatur statistik. Komponen layar ini memiliki sejarah panjang dalam grak statistik. Itu referensi biologi memberikansedikit indikasi latar belakang untuk ide-ide yang mendasari diperlukan untuk membangun peta panas. Pada artikel ini, kita menelusurigaris keturunan dari peta panas dan menunjukkan apa elemen yang14Figure 5:15Figure 6:akhirnya terintegrasi dalam tampilan yang ahli biologi akhirnya diadopsi.16Untuk menjelaskan sejarah layar ini, kami akan menyajikan masingmasing komponen yang mendasari desain peta klaster panas. Beberapa yang cukup lama, beberapa yang relatif baru.2.5.1 Shading Matriks• Pusat peta panas adalah matriks layar warna teduh. Berbayang menampilkanmatriks yang lebih dari satu abad tua. Gambar 2 menunjukkan contohdari Loua (1873). Gras ini merangkum berbagai statistik sosial di seluruh arondisemen Paris. Seperti gras lainnya dalam buku ini, itu digambar tangan dan berwarna. Shading tabel atau matriks adalah perangkatlama untuk menyoroti entri, baris, atau kolom. Akuntan, desainer gras,insinyur komputer, dan lain-lain telah menggunakan metode ini selamabertahun-tahun. Yang paling umum baru-baru ini aplikasi melibatkanpenggunaan warna untuk baris warna, kolom, atau sel-sel dari spreadsheet.2.5.2 Permuting Matriks• Peta klaster panas tidak lebih dari warna. Ini permutes baris dan kolomdari matriks untuk mengungkapkan struktur. Permutasi matriks memiliki sejarah panjang juga. Seperti ide shading, menyortir matriks atautabel untuk mengungkapkan struktur adalah lebih dari satu abad tua.Gambar 3 menunjukkan matriks diurutkan data pendidikan dari Brinton(1914). Gambar 4 menunjukkan contoh dari Bertin (1967). Jacques Bertindikhususkan bab untuk menggambarkan kegunaan apa yang disebut matriks reorderable. Contoh nya diurutkan dengan tangan.Seriation• Itu adalah antropolog yang mengembangkan salah satu model pertamauntuk memesan matriks data. Petrie (1899) berusaha untuk mengaturulang baris dan kolom dari matriks persegi panjang dari pengukuran padaantropologi artefak sehingga nilai terbesar akan dekat diagonal utama.Tujuan langsungnya adalah menggunakan atribut (kolom) untuk ceritaartefak (baris) dalam rangka memulihkan memesan temporal di artefak.Tujuannya memiliki implikasi baik di luar materi pelajaran nya. Petrietelah mengidentikasi struktur Toeplitz tersirat dalam pemesanan matriksdata berdasarkan waktu (atau beberapa dimensi lain). Artikelnya yangdihasilkan banyak literaturselama lebih dari satu abad pada topik bervariasi disebut seriationatau matriks penataan kembali (Robinson 1951; Kendall 1963; McCormick et al. 1972; Hubert 1974, 1976; Lenstra 1974; Ramah 2002;Ramah dan Kwan 2003; Climer dan Zhang 2006). Sepuluh tahun17Figure 7:Figure 8:18Figure 9:setelah Petrie, Jan Czekanowski mengembangkan metode seriationdan menggunakan Dialog berbayang gram untuk mewakili strukturdata blok-diagonal. Gambar 5 menunjukkan matriks diurutkan datapendidikan dari Czekanowski (1909). Display Czekanowski, kecualikurangnya pewarnaan dan pohon klaster ditambahkan, adalah miripdengan output dari program penataan kembali matriks komputerkontemporer (Liiv 2008)Guttman Scalogram• Lima puluh tahun setelah Petrie, Louis Guttman memperkenalkan permutasi matriks untuk mengungkapkan yang berbeda satu dimensi struktur.The Guttman Scalogram (Guttman 1950) adalah metode langsung untukpas model deterministik (a total order yang Guttman disebut Simplex)untuk matriks biner. Dalam metode Guttman, biner persegi panjang matriks itu permutasi dengan tangan (menggunakan kertas atau mesin tabulasi) untuk mendekati skala unidimensional: di bawah kuasi-diagonal yangmenjadi sebanyak 1 sebagai mungkin dan atas kuasi-diagonal, sebanyak 0sebagai mungkin. Sebuah matriks dengan struktur ini dikatakan scalable,menyiratkan pemesanan baris dan kolom. The Scalogram menemukanaplikasi luas dalam dekade berikutnya, terutama dalam ilmu-ilmu sosial.Ara- ure 6 menunjukkan contoh dari Rondinelli (1980). Program komputerakhirnya otomatis skala ini (Nie et al. 1970; Wilkinson 1979). Lainnyaakhirnya mengembangkan program analisis visual interaktif untuk memungkinkan pengguna untuk mengeksplorasi permutasi mereka sendiri (Siirtola dan Makinen 2005). Dan statistik dikembangkan stochastic generalisasi model Guttman yang memungkinkan permutasi ini untuk diterapkanlebih luas (Goodman 1975; Andrich 1978).Clustering hirarkis19Figure 10:• Tidak lama setelah Scalogram Guttman menjadi populer, analis klastermengambil minat dalam mewakili kelompok oleh asosiasi shading (kesamaan / ketidaksamaan) matriks. Sneath (1957) mungkin merupakanadvokat awal untuk gras ini. Ling (1973) memperkenalkan programkomputer, yang disebut SHADE, untuk menerapkan ide Sneath ini. LingProgram digunakan overstrikes pada printer karakter untuk mewakili derajat yang berbeda dari bayangan. Gower dan Digby (1981) dilaksanakantampilan Ling pada printer dot matrix. Gambar 7 menunjukkan contohdari bab mereka.Dua arah Clustering• Tak lama setelah kertas Ling, Hartigan (1974) memperkenalkan programpengelompokan blok dengan layar langsung dari persegi panjang matriksdata. Teori di balik program ini telah dibahas di Hartigan (1975).Kerja Hartigan ini, Wilkinson (1984) menerapkan dua arah pengelompokan hirarki rutin pada persegi panjang matriks data, menggunakan metode shading Ling untuk layar.Seriating a Binary Tree20Figure 11:Figure 12:21• Untuk pohon biner dengan daun n, ada 2 -n 1 orderings linear yangmungkin dari daun dalam tata letak planar pohon. Algoritma clusteringhirarki tidak menentukan tata letak tertentu. Oleh karena itu, kita perlualgoritma tambahan untuk Seriate baris / kolom dari matriks berkerumun. Gruvaeus dan WAINER (1972) mengembangkan algoritma serakahyang Wilkinson digunakan di layar SYSTAT. Gale et al. (1984) menyusunalgoritma alternatif untuk tujuan ini. Makalah yang lebih baru membahas masalah ini secara rinci dan menentukan algoritma optimasi denganfungsi obyektif yang dirancang untuk tugas (Wishart 1997; Bar-josephdkk. 2003; Morris et al. 2003). Aspek yang diinginkan dari algoritmaini adalah bahwa mereka menghasilkan total order ketika ada (misalnya,ketika matriks asosiasi memiliki bentuk Toeplitz).Appending Trees• Masih ada isu menambahkan pohon cluster untuk data matriks persegipanjang. Kita telah melihat contoh-contoh yang menambahkan sebuahpohon clustering untuk matriks asosiasi. Gower dan Digby (1981) mengambil langkah berikutnya dan ditambahkan pohon cluster untuk kedua barisdan kolom matriks asosiasi. Gambar 8 menunjukkan template mereka.Mereka tata letak dalam beberapa hal lebih unggul peta microarray panasmodern, karena bersamaan menampilkan baris dan kolom kesamaan /perbedaan-perbedaan yang clustering didasarkan. Chen (2002) dan lainlain yang diadopsi desain ini. Ini adalah langkah singkat dari desain iniuntuk tata letak yang dipilih oleh para ahli biologi. Pertama peta panasditerbitkan dalam bentuk ini muncul di Wilkinson (1994). Gambar 9 menunjukkan versi warna angka dari SYSTAT manual. Pada saat Eisen etal. (1998) muncul, ada puluhan ribu eksemplar SYSTAT beredar di komunitas ilmiah.Weinstein (2008) menemukan membangun klaster panas memetakansebuah "proses mengejutkan halus." Deskripsinya kehalusan ini tidakakan mengejutkan ahli statistik. Mereka yang akrab dengan literaturklaster tahu bahwa ada literatur.Isu-isu mengenai pilihan ukuran jarak (Euclidean, tertimbang Euclidean, City Block, dll) dan pilihan metode linkage (tunggal, lengkap,rata-rata, pusat massa, Ward, dll). Kettenring (2006) membahasmasalah ini dalam praktek. Selain itu, Weinstein menyebutkan masalahmemesan daun clustering pohon, menunjukkan bahwa "beberapa tujuan (tapi, untuk gelar, sewenang-wenang) aturan harus dipanggil untuk memutuskan mana cara masing-masing cabang akan, pada kenyataannya, ayunan "Seperti yang telah kami sebutkan, ini bukan tujuan yang sewenang-wenang.; itu a-didenisikan dengan baik masalahseriation. Paket statistik modern menerapkan tampilan peta panas22Figure 13:23sebagai bagian dari paket pengelompokan (misalnya, JMP dan SYSTAT) atau mereka membuatnya mudah untuk merencanakan petapanas menggunakan algoritma seriation (misalnya, R dan Stata).Dengan demikian, semua pilihan yang tersedia untuk pengelompokanatau analisis lainnya renderable di peta panas. Ini arsitektur eksibelmenggarisbawahi fakta bahwa peta panas adalah reeksi visual modelstatistik. ini bukan pemesanan sewenang-wenang baris dan kolomklaster pohon. Secara umum, peta matriks panas dapat dianggap sebagai display yang baris dan kolom telah permutasi melalui algoritma.Banyak referensi baru-baru ini dikutip dalam artikel ini menyebutkaneksplisit fungsi tujuan untuk mengevaluasi permutasi yang dihasilkan.Fungsi kerugian seriation populer adalah jumlah dari jarak antarabaris dan kolom yang berdekatan. Kita dapat meminimalkan fungsiini langsung pada dataset yang diberikan atau menggunakannya untuk mengevaluasi kebaikan dari seriation heuristik tertentu. Atau,kita dapat mencicipi nilai dari distribusi bivariat diketahui, mengacak baris dan kolom dalam matriks data sampel, dan membandingkansolusi dari algoritma seriation berbeda.Wilkinson (2005) yang dihasilkan matriks persegi panjang yang barisdan kolom covariances ditentukan oleh lima berbeda struktur kovarians: Toeplitz, Band, Edaran, Equicovariance, dan Blok diagonal. Dia kemudian secara acak baris dan kolom permutasi sebelummenerapkan beberapa algoritma seriation yang berbeda, termasukclustering, MDS, dan SVD. Secara keseluruhan, SVD pulih pemesanan asli lebih baik daripada metode lain yang digunakan pada semua lima jenis matriks. Temuan ini menunjukkan bahwa SVD sederhana mungkin yang terbaik metode seriation umum dan klaster yangmetode harus dibatasi kepada mereka dataset mana model clusteryang sesuai. Jika SVD yang dipilih, maka salah satu harus mempertimbangkan metode yang kuat terakhir untuk dekomposisi ini (Liu etal. 2003). Untuk data microarray, itu masih merupakan pertanyaanterbuka apakah seriation berbasis hirarkis-clustering lebih bergunadaripada pendekatan lain, meskipun popularitas dari metode ini.24Bab 33 Aplikasi pendukung Heatmap3.1 Qlucore Omics Explorer3.1.1 Apa itu Qlucore Omics Explorer?Qlucore adalah sebuah perusahaan dari Lund, Swedia, yang menyediakan software bioinformatika untuk industri ilmu kehidupan dan biotek. Para pendiriadalah Thoas Fioretos, profesor dan konsultan senior di Divisi Genetika Klinis diRumah Sakit Universitas Lund, Johan Rade, profesor matematika di UniversitasLund, Magnus Fontes, guru besar matematika di Universitas Lund dan presidenQlucore Carl-Johan Ivarsson. Saat ini, produk Qlucore digunakan di 23 negara.Produk utama perusahaan, Qlucore omics Explorer, menggabungkan metodestatistik dengan real time visualisasi dan antarmuka pengguna yang intuitif,sehingga memudahkan para ilmuwan biomedis untuk menganalisis data merekasendiri, atau bersama-sama dengan spesialis bioinformatika. Mesin perangkatlunak inti visualisasi data 3D serta 2D dan karena itu dapat membantu pengguna untuk mengidentikasi struktur dan pola tersembunyi. Kombinasi visualisasi, metode statistik canggih dan klik dan titik user interface yang mudahdigunakan telah membantu banyak ilmuwan dengan penelitian mereka.Perangkat lunak Qlucore omics Explorer dapat digunakan untuk menganalisis data set seperti:• ekspresi gen: RNA-seq, microarray, real-time PCR• MicroRNA: microarray, real-time PCR• DNA metilasi: microarray• ekspresi protein: microarray, array antibodi, 2-D gel• proteomik• Data metabolomik• Setiap data multivariat ukuran sampai dengan 1000 x 100.0003.1.2 Tutorial menggunakan Qlucore Omics Explorer (QOE)• Untuk memulai QOE, klik dua kali ikon Qlucore omics Explorer (shortcut) pada desktop atau mulai Qlucore omics Explorer dari Menu Programditemukan di Start Menu.• The QOE Jendela Utama akan muncul. Kita mulai dengan orientasi yangcepat dari apa yang Anda lihat pada layar, lihat gambar di bawah. Ditengah-tengah Anda menemukan Ruang Kerja di mana semua plot akan25ditampilkan di Plot Windows. Selanjutnya Anda menemukan beberapaDock Windows. Secara default Sampel, Variabel dan Log dermaga jendelamerapat ke kiri jendela utama dan Statistik dan Mendapatkan jendelaMemulai mengambang.• Di Menu Bar Anda dapat memilih dermaga jendela yang ditampilkan dibawah View> Dock Windows. Dari menu View Anda juga dapat meluncurkan GO Browser dan GSEA Workbench serta Quality Control (QC)laporan. Di bawah Menu bar Anda menemukan kontrol yang berbedayang mengatur fungsi alat mouse dan operasi dilakukan pada kumpulandata. Anda juga menemukan tujuh Tab yang berbeda: Data, Metode,Options, Lihat, Cluster, Membangun classier dan Classify, yang akanmembantu Anda untuk memilih dan mengelola alur kerja di QOE.• Di tepi jendela Statistik Anda dapat memilih metode statistik yang Andaingin gunakan untuk mempelajari dataset Anda.Akhirnya di bagian bawah Anda menemukan Status Bar. Dalam Status BarAnda menemukan misalnya jumlah total sampel dan variabel dalam set dataditampilkan dan informasi di berapa banyak dari mereka yang secara aktifmengambil bagian dalam analisis pada saat ini.Untuk memulai, kita pertama-tama mengembalikan pengaturan default.• Pilih File> Kembalikan Pengaturan Default item menu di Menu Bar• Pilih OK, ketika Anda akan ditanya apakah Anda ingin mengembalikanpengaturan defaultPerhatikan bahwa ketika nanti keluar QOE pengaturan saat ini akan disimpan dan digunakan berikutnya kali program dimulai dan Anda dapat dengandemikian secara langsung mulai bekerja dengan pengaturan yang terbaik sesuaidata Anda.Untuk membuka le data.• Buka menu Help> Contoh File> Qlucore Data Uji Set.gedataThe Qlucore Test Data Set sekarang terbuka di QOE dan Anda memiliki posisi awal untuk mulai menganalisis data. Apa yang Anda lihatsaat ini di Ruang Kerja adalah proyeksi komponen utama dari 12 sampel dari 50dimensi (sesuai dengan 50 pengukuran (variabel) untuk masing-masing sampel)turun ke ruang tiga dimensi yang direntang oleh tiga pokok pertama komponen.Sampel berwarna sesuai dengan sampel ID penjelasan seperti dapat terlihat dijendela Color Legend.Ke kiri, jendela Sampel dipilih secara default. Di sini Anda dapat melihatdan memanipulasi informasi yang terhubung ke sampel Anda. Sejalan dengan26Figure 14:27Figure 15:itu, Anda akan menemukan informasi berkaitan dengan variabel dengan memilihjendela Variable. Dengan memilih jendela Log Anda akan dapat membuat Logalur kerja Anda di QOE. Pada jendela Color Legenda Anda menemukan semuainformasi yang relevan, dalam bentuk yang mudah untuk ekspor, mengenaipewarnaan sampel atau variabel. Anda dapat memilih untuk menutup dermagajendela Color Legenda agar untuk mendapatkan ruang kerja yang lebih.Di atas Work Sheet dan di bawah menu bar Anda menemukan kontrol yangberbeda mengandung perintah untuk beberapa fungsi dasar. Di antara merekaadalah Data, Metode, Pilihan dan View tab. Data tab memiliki kontrol yangberhubungan dengan bagaimana data dipersiapkan untuk analisis masa depandan tab View berisi kontrol yang berhubungan dengan bagaimana data disajikan. Metode tab dipilih secara default dan di sana Anda menemukan kontrolyang berhubungan dengan analisis. Tab Options meliputi perbaikan dan penambahan metode yang tersedia di Metode tab. Anda memilih jenis petakdi tab Metode (Contoh PCA dipilih oleh default). Anda juga memilih caramenormalkan / skala data Anda di sini dan untuk membuat grak / jaringan.Tab Cluster mengontrol penciptaan otomatis dari cluster. Tab Build classiermeliputi fungsi untuk membangun pengklasikasi. The Mengklasikasikan tabmemungkinkan klasikasi sampel berdasarkan classier a.Ada beberapa jenis plot yang berbeda tersedia di QOE dan adalahmungkin untuk mengkongurasi plot dalam berbagai cara. Ada delapan jenis plot utama dan Anda memilih jenis petak di Metode tab.• PCA• Heatmap (Heat)• Scatter• Table• Line• Box• Bar• HistogramBeberapa plot dapat dikongurasi untuk menunjukkan baik sampel atau variabel. ini adalah dipilih menggunakan tombol mode di tab Metode. DalamTebar, Box, Line, Bar dan Histogram pilihan lebih lanjut tentang apa yangharus plot dibuat menggunakan alat Seleksi Axis data.28Figure 16:QOE memungkinkan tingkat eksibilitas yang tinggi dalam jumlahplot dan dataset yang Anda bisa buka secara paralel. Ketika banyakplot terbuka plot yang terakhir diaktifkan oleh kiri klik dengan Mousedisebut plot aktif. Operasi yang dipilih biasanya akan mempengaruhiplot aktif.Statistik jendela yang penting dan Anda memiliki kebebasan untukposisi jendela ini dimanapun Anda inginkan di layar Anda. Kamikemudian akan menjelaskan beberapa fungsi jendela Statistik• Pindahkan jendela Statistik untuk melihat dengan jelas sampel ditampilkan.Sebelum kita melanjutkan kita akan membiasakan diri dengan struktur dasardari Qlucore Uji Data Set. Sebuah subset dari kumpulan data disajikan dalamtabel di bawah. Kumpulan data termasuk 50 variabel yang diukur untuk 12sampel.• Lima baris pertama adalah penjelasan sampel dan yang pertama tigakolom adalah penjelasan variabel.Data matriks dimulai dengan sel dengan nilai "0,071".Sekarang, mari kita lanjutkan. Semua perintah yang diberikan di QOEsegera mempengaruhi proyeksi ditampilkan di Plot Windows.• Pilih tab View• Pada bagian Warna tab View, pilih untuk warna sampel Anda sesuaidengan penjelasan "Treatment".Ini akan mewarnai aktif PCA plot contoh. Pada tab View ada lebih banyakmewarnai Pilihan dan pilihan akan berubah tergantung pada jenis plot yang aktif. Dalam tutorial kita akan menyebutkan beberapa pilihan warna tapi janganragu untuk mencoba milikmu.29Figure 17:Figure 18:• Dalam Tool Box Anda memilih fungsi mouse (Move tombol radio di sudutkiri atas diperiksa secara default).Ketika Move dipilih, Anda dapat memutar gambar dengan menekan kiri mousetombol dan drag gambar dengan mouse di Ruang Kerja• Pilih Pusat di Tool Box dan kemudian klik kiri pada sampel di plot. Thesampel yang dipilih kemudian ditempatkan di pusat Plot WindowDengan mengklik kiri sampel lain, sampel ini akan ditempatkan di tengahsebaliknya. Oleh mengklik Batal di Tool Box plot aslinya dikembalikan.Clear dan Multi dua kontrol yang mempengaruhi penggunaan alatmouse yang dipilih. Yang jelas akan menghapus semua tanda dan label yang dipilih dan Multi akan memungkinkan Anda untuk membuatbeberapa Pilihan.30Figure 19:• Pilih Move.Di sudut kiri bawah dari jendela utama Anda menemukan Status Bar.Di sini Anda melihat teks 12/12 Sampel, menunjukkan bahwa semua sampel yang tersedia saat ini dipertimbangkan dalam alur kerja,masing-masing dari mereka sesuai dengan salah satu dari 12 bulatankecil yang Anda lihat diplot di layar.• Pilih Info di Tool Box dan kemudian klik kiri pada sampel.3.1.3 Analisis statistik dengan Visual FeedbackPada bagian ini kita akan terus bekerja dengan hanya satu petakaktif dan itu akan menjadi heatmap. Kami akan melakukan uji statistikdan memvisualisasikan hasilnya secara bersamaan. Kita akan menggunakanheatmap untuk menghasilkan umpan balik visual. Kita bisa bekerja denganjenis rencana tapi untuk alasan pedagogik kami memperkenalkan jenis plot baru.Pilih Heat di tab Metode.Anda akan langsung mendapatkan plot di bawah ini.Catatan: bagian putih dari heatmap menunjukkan nilai-nilai yang telahdirekonstruksi menggunakan rekonstruksi nilai yang hilang. Pada tab Datametode untuk nilai yang hilang rekonstruksi dapat dipilih. Silahkan lihat manual Referensi untuk lebih jelasnya tentang hilang nilai-nilai.Anda pilih Normalisasi dalam kotak Normalisasi pada tab Metode. Standarnya adalah untuk menyajikan data dinormalisasi.Pertama kita meningkatkan plot dengan menambahkan elemen visual tambahan.• Pilih Warna Sampel di tab View dan kemudian warna dengan anotasi"Treatment".• Kemudian pilih Orde Sampel di tab View dan pilih "Hierarchical clustering"Ada empat algoritma yang berbeda (Linkage) bahwa Anda akan menemukandi Options tab untuk menghasilkan cluster (mean, rata-rata tertimbang, minimum dan maksimum linkage). Kami mengacu pada referensi manual untukinformasi lebih lanjut tentang ini dan informasi terkait di heatmaps dan clustering. Clustering dapat didasarkan baik pada:31Figure 20:Figure 21:32Figure 22:• Kovarian (yaitu menggunakan data dinormalisasi berarti 0 untuk setiapvariabel), atau• Korelasi (yaitu menggunakan data dinormalisasi berarti 0 dan varians 1untuk setiap variabel).3.1.4 Menggunakan Jaringan dan GrakAnda dapat dengan mudah membuat grak di QOE menghubungkan sampelatau variabel. ketika membuat grak jarak yang terlibat selalu jarak Euclideandalam ruang penuh semua sampel aktif atau variabel. Grak memberi Andakesempatan untuk, dalam arti, melihat ke dalam dimensi yang lebih tinggi .12 Menggunakan Jaringan textbox di tab Cara Anda dapat membuat grak /jaringan dalam berbagai cara.• Hapus tanda centang pada Axes kotak centang di Plot Setting textbox dibawah View tab untuk melihat grak Anda akan menciptakan lebih jelas.Dalam Jaringan teks-kotak di bawah Metode tab y ou pilih jumlah terdekattetangga yang, untuk setiap sampel yang berbeda, akan bergabung dengangrak. Dengan menyeret slider Anda membuat grak dengan memilih semuatetangga dalam jarak yang dipilih. Cobalah.• Letakkan slider jarak ke 0 dan mengubah nilai ke 5. Anda dapat melakukanhal ini baik oleh menggunakan tombol-tombol pilihan atau dengan menulislangsung di kotak teks dan kemudian tekan Back.3.1.5 Modifying annotations• Atur jaringan di Network textbox 0 lagi untuk menghapus grak.• Pilih tombol New Value di panel Sample Value di jendela Sample Dock.Sebuah Nilai Baru muncul di Tabel Nilai dan dipilih secara otomatisPerhatikan bahwa Anda dapat mengubah nama New Value yang munculdi Nilai Table hanya dengan mengklik ganda di kotak teks yang sesuai danmemasukkan nama disukai.• Pilih Annotate di jendela Tool Box. Ini akan mengubah perilaku toolMouse untuk menetapkan sampel ke nilai sampel penjelasan.33Figure 23:Figure 24:• Klik sampel (subkelompok jelas dilihat dari "" yang paling dekat dengan subkelompok hijau "TEL-AML1") satu per satu. Sampel tersebutkemudian dipindahkan ke kelompok sampel "New Value".Catatan bahwa jika Anda kebetulan memindahkan beberapa sampel tidak sengaja Anda dapat membatalkan perintah terakhir Anda dengan memilih tombolUndo di Toolbar Nilai.Plot di bawah ini adalah dari tengah proses reklasikasi. Beberapasampel tidak dijelaskan dalam kelompok baru (= biru muda) danbeberapa masih putih. Dengan memilih Move di Tool Box, Anda dapatmemutar plot dan memeriksa bahwa Anda telah menandai semua sampel. Jikatidak, Anda memilih Anotasi lagi dan menyelesaikan operasi. Ketika Anotasidipilih dalam Tool Box, Anda dapat memilih multi dan Anda kemudian memilikipilihan untuk memilih beberapa sampel dengan menggambar kurva tertutup34di sekitar mereka. Anda melakukan ini dengan menekan tombol kiri mousesementara pada saat yang sama bergerak pointer (mouse) jam bijaksana sekitarsampel yang dipilih untuk membuat kurva tertutup.Catatan: Jumlah variabel mengambil bagian dalam perubahan analisis ketikaAnda memperbarui subkelompok penjelasan. Hal ini disebabkan fakta bahwap-value diatur ke 1e-7 dan set variabel aktif sesuai dengan ini p-nilai di bawahuji statistik yang dipilih tergantung pada subkelompok yang kita pilih untukmembedakan. Dengan subkelompok baru kami telah menambahkan informasiapriori dan diharapkan bahwa analisis ANOVA dipengaruhi.• Pilih Move di Tool BoxSekarang kita akan membuka jendela Plot lain di Ruang Kerja.3.1.6 Multiple Plot WindowsAnda dapat setiap saat selama analisis membuka jendela Plot baru di RuangKerja. Ini Plot baru Windows yang membuka dapat disinkronkan dengan aktif(disorot) Plot Jendela atau tidak. Jika Plot Windows disinkronkan, mereka akanselalu berbagi sampel aktif yang sama dan / atau variabel, tetapi mereka dapat,misalnya, akan diwarnai sesuai dengan penjelasan yang berbeda. Model kerjaini sangat berguna karena Anda dapat kembali melihat beberapa aspek daridata Anda di ruang kerja yang sama. Anda mengaktifkan (memilih) WindowPlot dengan mengklik di mana saja di dalamnya. Bingkai jendela Plot sedangaktif selalu disorot.• Pilih Window> New Synchronized Plot di Menu Bar.Perhatikan bahwa Anda sekarang memiliki dua Plot Windows yang berbedaterbuka di Qlucore omics Explorer. Anda dapat menemukan mereka terdaftardi bawah Window pada Menu bar.• Anda dapat memilih jendela untuk menampilkan atau Anda dapat menampilkansemua jendela dengan memilih Window> Tile di Menu bar.• Pastikan bahwa Plot Window baru aktif dan pilih Novel Group di textboxAnotasi Contoh di Sample Dock Window.• Pilih Sample Color Button di Sample Annotations Toolbar untuk mewarnai sampel dalam jendela aktif sesuai dengan Novel group attributeKita sekarang dapat melihat Nilai subkelompok baru kita di jendela kanan sesuaidengan "Grup Novel" di jendela kiri.3.1.7 Mengerjakan dengan VariabelMeskipun kami memiliki, tegasnya, telah bekerja dengan variabel sepanjangwaktu, karena kami telah disaring data, kita sekarang akan kita lihat secaraeksplisit.35Figure 25:Figure 26:• Buat Jendela Plot Synchronized baru dengan memilih menu Window danNew Synchronized Plot.• Pilih Tile di menu Window untuk melihat kedua plot• Pastikan bahwa Plot Jendela sebelah kiri adalah aktif dan kemudian pilihPlot Jenis PCA dan Modus Variabel di tab Metode untuk menampilkanPCA petak variabel.Hal ini memberikan dua berikut plot:Di Window Plot kiri atas Anda melihat plot PCA dari 115 variabel aktifberpartisipasi dalam analisis saat ini.• Pilih jendela kiri dengan mengklik di mana saja di dalamnya, untuk mengaktifkannya.• Pilih Warna Bar. di bawah View Tab.• Pilih untuk mewarnai variabel "by data for one or more samples" dan kemudian pilih Leukemia Subtipe penjelasan dan akhirnya kelompok "E2APBX1".Ada sejumlah cara untuk variabel warna (Solid, varians, R2, ...)melihat daftar pilihan Color Variabel untuk semua pilihan. Variabel36Figure 27:Figure 28:sekarang berwarna sesuai dengan tingkat ekspresi mean dalam kelompok subtipedipilih dalam Tabel Nilai untuk Sampel ("E2A-PBX1"). Red berarti sangatdisajikan, yaitu mereka up-diatur dalam kelompok Sampel dipilih dan hijausesuai dengan turun-diatur gen.Di Plot Jendela sebelah kiri bawah Anda melihat PCA petak tiga dimensidari 115 variabel, mengambil bagian dalam analisis pada saat ini, berwarnasesuai dengan tingkat ekspresi berarti mereka dalam Contoh subtipe kelompok"E2A-PBX1". Perhatikan bahwa karena kita telah memilih untuk bekerja dengan plot disinkronkan, variabel sangat disajikan dalam kelompok "E2A PBX1"ditemukan dalam arah yang sama di plot sebagai kelompok "E2A-PBX1" itusendiri.• Pilih View> Dock Jendela> Color Legenda untuk melihat skala warna37Figure 29:Figure 30:Sekarang kita akan membuat daftar gen yang paling diregulasi dalam kelompok"E2A-PBX1".• Pilih Variable Dock Window• Pilih Daftar di Tool Box (agar mampu membuat pilihan ini, plot jendelakanan harus aktif).Variabel daftar baru tersedia di Variable Daftar Tabel, menampilkan genyang dipilih. Perhatikan bahwa penjelasan untuk gen yang dipilih dalam daftarnama variabel yang ditemukan di Variable Anotasi Table. Alat Daftar bekerjadi jenis tanah termasuk variabel. Ini bisa menjadi plot PCA variabel, petapanas atau plot pencar. Dengan tombol Pilih Kolom di jendela dock variabelAnda dapat memilih informasi apa yang ingin hadir di Tabel Variabel.Anda dapat misalnya mendapatkan p dan q-nilai untuk setiap variabel individu. Buat salinan dari daftar yang telah Anda buat menggunakan tombol danberi nama daftar untuk misalnya "Memisahkan E2A-PBX pilihan", akhirnyapilih tombol Save untuk menyimpan daftar variabel untuk digunakan di acarananti.38Figure 31:Dengan tombol Open, Anda dapat mengimpor daftar variabel yang sudahdisimpan. Hal ini dimungkinkan untuk memiliki variabel banyak daftar terbukapada waktu yang sama. Daftar baik dapat dibuat dalam QUOTE, karena kamihanya melakukan, atau menjadi daftar pengenal variabel dibuat dari sumberlain (kategori gen ontologi, jalur, ..).3.1.8 Membuat PenggolonganCara alternatif, untuk uji statistik, untuk mengidentikasi variabel(tur) dari bunga acuan misalnya ketika tujuannya adalah untukmelakukan penemuan biomarker, adalah untuk menciptakan classi-er dan mengamati variabel yang yang dipilih. Daftar ini variabeladalah titik awal yang baik untuk memahami variabel yang yang terbaik potensial biomarker. Membangun classier yang dilakukan dari tabBuild Classier. output adalah classier, laporan luas dan daftar variabel variabel yang dipilih.3.1.9 Analisis lebih lanjut dan eksplorasiPada titik ini dalam analisis kita telah membahas berbagai fungsidan Anda memiliki membiasakan diri dengan metode seleksi, pilihanpewarna, plot disinkronkan dan banyak lagi. Pada bagian berikut kitaakan lebih singkat menyoroti fungsi tambahan. Kita mulai denganplot Box.Box plot• Tutup Variabel PCA39Figure 32:• Tutup Correlated Variable Box• Periksa daftar Variabel aktif untuk mencakup semua variabel• Ganti ke Filter oleh Dua Kelompok perbandingan dan E2A-PBX1• Pilih tab Metode dan mengubah jenis rencana untuk Box.Untuk mengisi plot, data untuk sumbu X dan sumbu Y kebutuhan untuk dipilih.Arahkan ke X Axis drop down box di Axis data Box di Metode Tab dan pilihAnotasi Contoh "Leukemia Subtipe".• Pilih Y Axis di Tool Box• Pilih Variable dalam daftar pencarian di Variable window.Anda harus mendapatkan plot seperti di bawah ini. Seperti yang diharapkan nilai-nilai untuk variabel ini tinggi di Blue kelompok (E2A-PBX1) karenaitu adalah bagaimana kita memilih variabel dari awal. Setiap kotak dihitungberdasarkan sampel di sub kelompok masing-masing. Bagian dari kotak didenisikan menurut berikut:• Garis putus-putus adalah nilai mean• Batas atas kotak adalah 75 persentil (default)• Batas bawah kotak adalah 25 persentil (default)• Secara default tepi kotak ditetapkan pada nilai data titik terendah masihdalam 1,5 kali kisaran kotak batas kotak yang lebih rendah, dan pada nilaititik data yang tertinggi masih dalam 1,5 kali kisaran kotak batas kotakatas. Lingkaran mewakili outlier potensial dan mereka didenisikan olehelemen data di luar tepi.Bar plot40Figure 33:Bar Plot dapat dikongurasi dalam beberapa cara dan juga mendukung operasi pada kelompok (seperti rata-rata)• Bar Plot dapat dikongurasi dalam beberapa cara dan juga mendukungoperasi pada kelompok (seperti rata-rata)• Bar Plot dikendalikan dari tab Metode mana sumbu X dan sumbu Ykonten yang dipilih. Operasi data dikendalikan dari tab Options. Daritab View adalah kongurasi visual yang dioperasikan.• Plot pertama di bawah ini menunjukkan kumpulan data Qlucore Test.Sumbu X pertama memerintahkan sesuai dengan penjelasan "Treatment"yang memiliki tiga nilai ("Drug 1", "Drug 2" dan "Placebo"), urutankedua adalah dengan penjelasan "Gender". Ini berarti bahwa dalam setiap "Treatment" subkelompok bar yang diperintahkan menurut "Gender", dari plot kita melihat bahwa "Perempuan" sampel pertama dankemudian "Pria".Dalam Pilihan Data tab yang berbeda Campurkan operasi pada data dapatdidenisikan. Dalam plot bawah data rata-rata. Operasi selalu berlaku untukpenjelasan kedua yang dipilih di tab Metode.Line plots and Kaplan Meier survival plot Untuk menghasilkan penjelasan plot Kaplan Meier Sampel yang mengandung waktu kelangsungan hidupitu diperlukan. Informasi sensor juga dapat digunakan. Ini kemudian harustersedia sebagai Contoh penjelasan kedua.• Pilih plot Line dan pilihan Kaplan-Meier di X-Axis data Selection padatab Metode. Juga menentukan jika data harus diatur dalam kelompokyang berbeda.41Figure 34:Figure 35:42Figure 36:• Berikut ini adalah contoh dari set data uji Qlucore. Kelangsungan hidupbagi pasien dalam tiga berbeda "Treatment" kelompok ("Drug 1", "Drug2" dan "Placebo") disajikan.Scatter plots Scatter plots sangat eksibel dan mereka dapat diisi dengandata dalam berbagai cara. Contoh pertama adalah Sampel scatter plot.• Pilih plot tipe Scatter dan mode Sampel dalam Metode Tab.• Pada Tab Data, uncollapse data. Ubah pengenal Variabel untuk probesetID• Pilih alat X Axis di Tool Box dan pilih variabel pertama dalam daftarPencarian• Pilih alat Y Axis di Tool Box dan pilih variabel kedua dalam daftar Pencarian• Pilih tab View dan Warna sampler dengan anotasi "Leukemia Subtipe"Ini harus memberikan plot berikut. Satu variabel pada setiap sumbu dan semuasampel aktif diplot. Terhadap "E2A-PBX1" kelompok (Biru) terpisah dalamplot karena itu adalah perilaku variabel dalam arus daftar pencarian.Contoh kedua adalah Variabel Scatter Plot.• Pilih plot tipe Scatter dan mode Sampel dalam Metode Tab.• Pilih Sample Window untuk melihat penjelasan sampel. Periksa bahwaannotasi "Leukemia subtipe" terlihat.• Pilih alat X Axis di Tool Box dan pilih sampel pertama di Sample Table(perhatikan bahwa angka-angka mungkin berbeda).43Figure 37:Figure 38:44Figure 39:• Pilih alat Y Axis di Tool Box dan pilih grup E2A-PBX1 di Jendela Sampel.• Pilih tab View dan pilih untuk Warna variabel dengan anotasi "LeukemiaSubtipe".Pada sumbu X adalah Contoh bernama "E2A-PBX 12 M # 1" di semua subplot. Pada masing-masing sumbu Y adalah sampel pada kelompok E2A-PBX1.Setiap titik di plot merupakan salah satu 470 variabel aktif.3.1.10 Mengekspor gambar, animasi dan data lainnya• Anda dapat mengekspor setiap saat selama analisis berkelanjutan eksporgambar atau animasi dari QOE.• Anda melakukan ini dengan memilih File> Ekspor> Gambar atau File>Export> Video, dan kemudian memasok nama dan karakteristik lain darile yang diekspor.• Anda juga dapat mengekspor komponen utama, jarak sampel, penjelasandan data penting lainnya untuk analisis hilir, melihat File> Export.• Dalam GSEA Workbench ada dua fungsi ekspor terpisah: Daftar ekspordan Hasil. Ekspor Daftar transfer salinan daftar yang dipilih ke QOEutama daftar antarmuka program.45Figure 40:• Dalam GO Browser Daftar Ekspor transfer hasil pencarian ke QOE utamadaftar antarmuka program.Juga mencatat bahwa adalah mungkin, pada setiap titik dalam analisis, untukmenyelamatkan keadaan saat lengkap QOE dengan menggunakan fungsi Log.Anda kemudian dapat kembali ke titik tertentu dalam analisis, dengan membukale log yang sesuai di QOE, dan pilih titik log tertentu.46Bab 44 Kasus pemanfaatan pada Qlucore Omics Explorer4.1 Uji HipotesisUji Hipotesis adalah semua tentang membuat keputusan mengenai satu ataulebih populasi, menggunakan informasi yang diberikan oleh pengambilan sampel dari populasi tersebut. Sebelum kita mulai, penting bahwa populasi yangkita tertarik didenisikan secara hati-hati dan bahwa set data yang diperolehdari sampel adalah wakil dari populasi ini. Misalnya, mengatakan bahwa kamitertarik dalam pengujian jika pria, rata-rata, lebih tinggi daripada wanita, danbahwa kita mengukur 100 orang yang dipilih secara acak dan 100 wanita yangdipilih secara acak dari wilayah geogras tertentu. Bisakah kita kemudian menggunakan hasil dari uji statistik untuk mengatakan sesuatu tentang ketinggianrata-rata di populasi di seluruh dunia laki-laki dan perempuan? Jika ada efekregional, hasilnya hanya mungkin benar untuk populasi laki-laki dan perempuan di wilayah kita belajar. Kemampuan untuk membuat keputusan tentangpopulasi hanya menggunakan informasi sampel adalah penting karena seringtidak layak untuk mempelajari seluruh populasi (jika kita bisa, tidak akan adakebutuhan untuk uji statistik). Kelemahan dari pendekatan ini adalah, tentusaja, bahwa karena kita tidak mempelajari seluruh populasi, kita tidak pernahbisa menarik kesimpulan tentang hal itu dengan kepastian 100%. Kerangka UjiHipotesis memungkinkan kita untuk menangani ketidakpastian ini dengan caraformal.4.1.1 Apa itu Hipotesis?Sebuah hipotesis statistik adalah pernyataan mengenai populasi bunga. Dalamrangka pengujian hipotesis umum, kita memiliki hipotesis nol (H0) dan hipotesisalternatif (Ha). Hipotesis nol sering merupakan keadaan "tidak berpengaruh".Pada contoh di atas ketinggian, hipotesis dapat• H0: tidak ada perbedaan antara ketinggian rata-rata pria dan wanita• Ha: ada perbedaan antara ketinggian rata-rata pria dan wanita4.1.2 Apa itu nilai P?Hasil tes hipotesis statistik sering diwakili dengan cara p-nilai. Untuk mendapatkan dari nilai-nilai yang diamati dari variabel kami untuk p-value, pertamakita perlu membangun sebuah uji statistik. Uji statistik memberikan ringkasannumerik dari data sampel dan dirancang untuk menangkap efek yang kita tertarik belajar. Pada prinsipnya, kita bisa memikirkan banyak statistik uji yangakan menangkap efek yang diberikan. Alasan untuk memilih statistik tertentu47sering bahwa di bawah beberapa asumsi mengenai populasi yang mendasari,kita bisa menghitung secara teoritis bagaimana statistik akan didistribusikanjika hipotesis nol itu memang benar. Kemudian, kita dapat membandingkannilai yang kita dihitung dari data kami sampel untuk distribusi ini dan mengatakan bagaimana mungkin akan mendapatkan nilai statistik uji yang samaatau lebih ekstrim daripada diamati satu, mengingat bahwa hipotesis nol benar. probabilitas ini justru denisi dari p-value. Dalam contoh di atas, p-nilaikecil akan berarti bahwa itu akan sangat tidak mungkin untuk mendapatkan nilai statistik uji yaitu sebagai atau lebih ekstrim seperti yang kita telah dihitungdari sampel kami, jika ada benar-benar tidak ada perbedaan antara ketinggianrata-rata laki-laki dan perempuan dalam populasi.Sebaliknya, p-nilai yang besar berarti bahwa sangat mungkin untuk mendapatkan seperti nilai ekstrim bahkan jika hipotesis nol benar. Dengan demikian,dalam kasus terakhir tidak akan ada bukti yang signikan untuk efek seks padatinggi karena tampaknya, kita bisa sangat baik telah mengamati ketinggiandiperoleh dalam percobaan kami bahkan jika tidak ada perbedaan antara ketinggian rata-rata pada wanita dan laki-laki populasi . Jika dihitung p-nilai dibawah ambang batas signikansi pra-ditentukan (sejauh ini, ambang batas signikansi yang paling umum adalah 0,05) kita menolak hipotesis nol. Sebaliknya,jika p-value berada di atas ambang batas signikansi, kita tidak menolak hipotesis nol. Beberapa hal yang perlu diperhatikan (lihat juga artikel oleh Goodmanuntuk diskusi yang lebih luas):• Nilai p tidak memberitahu Anda seberapa besar kemungkinan itu adalahbahwa hipotesis nol benar. Demikian pula, ia tidak memberitahu Andaseberapa besar kemungkinan itu adalah bahwa hipotesis alternatif benar.• Jika Anda tidak dapat menolak hipotesis nol, Anda belum membuktikanbahwa hipotesis nol benar, tetapi hanya bahwa data saat set tidak memberikan cukup bukti untuk menolaknya. - Tidak ada yang "ajaib" dengantingkat signikansi 0,05. Pada tahun-tahun awal pengujian hipotesis, tabelyang digunakan untuk menentukan daerah penolakan untuk uji statistik.daerah tersebut pra-dihitung dan ditabulasi untuk ambang p-value beberapa saja. Namun, komputer saat ini dengan mudah memberikan tepatp-nilai dan dengan demikian nilai yang sebenarnya harus dilaporkan bukanhanya, misalnya, p <0,05. Memiliki aktual p-nilai ini juga diperlukan untuk menghitung dikoreksi p-nilai (q-nilai, lihat di bawah).4.1.3 Apa itu nilai Q?Menggunakan p-nilai untuk menafsirkan hasil uji statistik bekerja dengan baikjika kita hanya melakukan satu tes (yaitu, jika kita hanya memiliki satu variabeldalam set data kami). Setelah jumlah tes meningkat, kegunaan dari p-nilai sebagai ukuran signikansi menurun. Untuk melihat mengapa, asumsikan bahwakita memiliki 10.000 variabel dalam set data kami, dan bahwa hipotesis nol benar untuk masing-masing dan setiap satu dari mereka. Sekarang menerapkanuji statistik untuk masing-masing variabel. Karena denisi dari p-value, kami48berharap 5% dari variabel untuk memberikan nilai-nilai statistik uji yang lebihekstrim daripada apa yang diperlukan untuk menolak hipotesis nol pada tingkatsignikansi 0,05. Dalam contoh khusus ini, dengan demikian kita akan memilikisekitar 0,05 * 10.000 = 500 variabel dengan p-nilai di bawah 0,05, meskipunhipotesis nol sebenarnya berlaku untuk semua variabel! Ini disebut penemuanpalsu, atau positif palsu. Jika memang ada beberapa variabel dalam data yangada perbedaan yang benar, mereka akan dicampur dengan positif palsu.Interpretasi alternatif, cocok untuk situasi di mana beberapa tes dilakukan,diberikan oleh tingkat penemuan palsu (FDR). FDR adalah fraksi yang diharapkan dari penemuan palsu di antara semua hasil tes signikan. HaInterpretasialternatif, cocok untuk situasi di mana beberapa tes dilakukan, diberikan olehtingkat penemuan palsu (FDR). FDR adalah fraksi yang diharapkan dari penemuan palsu di antara semua hasil tes signikan. Hal ini dimungkinkan untukmenghitung dikoreksi Nilai P, atau Nilai Q, untuk masing-masing variabel. Nilai Q adalah analog FDR dari Nilai P konvensional. Untuk variabel tertentu(misalnya, dengan p-value p *), Nilai Q memperkirakan fraksi penemuan palsudi antara semua variabel dengan Nilai P di bawah p *. Perhatikan bahwa Nilai Q tidak memberikan probabilitas bahwa variabel sebenarnya adalah positifpalsu. Oleh karena itu, ia tidak memberitahu Anda yang variabel yang palingmungkin penemuan palsu. Untuk mendapatkan perasaan untuk tarif penemuanpalsu, bayangkan mengambil semua Nilai P yang dihitung dan lapisan mereka,memerintahkan dalam urutan yang meningkat. Menetapkan cuto signikansisekarang berarti untuk memutuskan ambang (misalnya Nilai P 0,05), dan mempertimbangkan semua nilai p di bawah ambang batas yang mewakili "penemuan". Tingkat penemuan palsu adalah fraksi yang diharapkan dari penemuanpalsu di antara ini, yaitu, fraksi penemuan yang hipotesis nol benar-benar benar(ingat bahwa hipotesis nol didenisikan dalam hal parameter populasi). Sebuahpenemuan palsu demikian variabel yang memperoleh pvalue rendah hanya kebetulan acak, tanpa sinyal mendasari benar dalam populasi. Salah satu carauntuk mengurangi jumlah penemuan palsu akan mendorong cuto signikansilebih dekat ke nol. Namun, sejak penemuan palsu dicampur dengan penemuanyang benar (yang untuk yang ada benar-benar berpengaruh pada tingkat populasi), ini akan mengecualikan banyak penemuan yang benar. Dengan kata lain,kita sering perlu untuk memungkinkan beberapa penemuan berpotensi palsuuntuk mendapatkan orang-orang yang benar. Nilai Q dihitung dengan Qlucoreomics Explorer dapat digunakan dalam cara yang berbeda. Satu pendekatanadalah untuk memutuskan mana yang diharapkan sebagian kecil dari penemuanpalsu yang satu bersedia menerima dan kemudian menetapkan ambang batasNilai Q yang diinginkan, di toolbox Statistik, untuk fraksi ini. Di antara variabelyang tersisa setelah prosedur ini, Anda dapat mengharapkan fraksi penemuanpalsu untuk tidak melebihi fraksi ditentukan (perhatikan bahwa mungkin terjadibahwa tidak ada variabel tetap setelah prosedur ini, jika batas tingkat penemuanpalsu yang diinginkan terlalu ketat). Apa tingkat yang dapat diterima dari penemuan palsu tentu saja sangat bergantung pada aplikasi tertentu, tetapi 10%(yaitu ambang nilai Q 0,1) adalah wajar dalam banyak kasus. Pendekatan keduauntuk menggunakan Nilai Q adalah untuk menentukan cuto signikansi den-49gan cara lain (misalnya, berdasarkan Nilai P seperti digambarkan di atas). NilaiQ terbesar di antara variabel yang tersisa kemudian dapat digunakan sebagaiperkiraan fraksi penemuan palsu di antara. Perlu diingat bahwa Nilai Q, sepertiNilai P, terkait dengan tes tertentu dan dengan demikian memeriksa bahwa pengaturan di toolbox Statistik setuju dengan tes yang ingin Anda lakukan.4.1.4 Haruskah saya gunakan uji satu sisi atau dua sisi?Pilihan satu-sisi atau dua sisi (kadang-kadang satu-ekor atau dua ekor) tesdatang ke rumusan hipotesis Anda (dan karenanya, pilihan harus dibuat sebelum ujian diterapkan). Sebuah uji satu sisi mengasumsikan bahwa hanyapenyimpangan dalam satu, pra ditentukan, arah menarik (yaitu, sesuai denganhipotesis alternatif).Dalam kebanyakan situasi, uji dua sisi ini bisa dibilang yang paling tepat,dan penggunaan uji satu sisi umumnya membutuhkan motivasi yang cukup besar. Asumsikan, misalnya, bahwa kita mencoba obat baru, dan kami inginmembandingkannya dengan pengobatan konvensional. Dalam situasi ini, kitamungkin menganggap bahwa obat baru akan tampil lebih baik daripada pengobatan lama, dan dengan demikian menggunakan uji satu sisi. Namun, iniberarti bahwa bahkan jika obat baru ternyata melakukan jauh lebih buruk dariyang lama, semua dapat kita katakan dari satu tes sisi adalah bahwa kita tidakdapat menolak hipotesis nol bahwa itu adalah sama baik atau lebih buruk daripada pengobatan lama. Jelas, hal itu mungkin sangat baik menjadi menarikuntuk mengetahui apakah obat baru sebenarnya secara signikan lebih burukdari yang lama, bahkan jika hasil ini tak terduga.Dalam Statistic Dock Windows Anda mengontrol jenis uji statistikyang ingin Anda siapkan. Tes yang tersedia adalah:• Dua Kelompok Perbandingan (t-test)• Multi Grup Perbandingan (F-test)• Regresi Linear• Regresi Kuadrat• Regresi PangkatKomponen lain dari dialog statistik adalah Variance slider di atas, p valueslider dan Fold Change slider. Penggunaan slider varians tercakup dalam bagian"Basic eksplorasi" pada halaman 27. p-value slider digunakan untuk memilihp-value pembatas untuk uji statistik yang dipilih. The fold change diterapkansetelah Variance dan uji statistik. Perubahan fold hanya didenisikan untukdua perbandingan kelompok.Di bagian atas dialog statistik terdapat informasi masukan. Ini menunjukkanberapa banyak variable yang digunakan sebagai input untuk lter. Jika Anda50Figure 41:tidak melakukan pilihan dalam Variabel, maka tab itu akan mengatakan "Semuavariabel aktif". Kotak merah adalah nilai Proyeksi.Catatan: tab Advanced adalah interface untuk statistik r-script.Untuk mengatur tes dan menemukan variabel yang paling terpisah"Placebo" dari "Drug 1" dan "Drug 2", dan memiliki perubahanFold minimal 1,5, melaksanakan langkah-langkah berikut:• Pilih Filter dari Dua Kelompok Perbandingan (t-test) di jendela Statistik.• Pilih "Treatment" di kotak Combo• Pastikan bahwa "Placebo" disorot dalam kotak Combo ketiga• Pindahkan Lipat Perubahan slider ke 1,5.Sesuaikan slider p-value ke-nilai p dari 0,0265, melakukannya perlahan-lahan.Anda dapat melihat bagaimana heatmap diperbarui terus menerus dan jumlahvariabel yang memenuhi batasan Kriteria menurun. Ada 3 variabel yang memiliki value p dari 0,0265 atau lebih rendah untuk t-test (Pengujian "Placebo"dipilih terhadap sampel dalam kelompok "Obat 1" dan "Obat 2") yang memiliki change Fold minimal 1,5.Yang sesuai value q (0.015698) (yang dapat diartikan sebagai penemuanrate palsu) juga ditampilkan di Windows Statistik dan 3 variabel yang sekarangtersisa di analisa memiliki kenaikan statistik yang tinggi. Berapa banyak Andaharus menyaring tergantung pada struktur data dan apa tingkat signikansiyang ingin Anda capai. Hasil ditunjukkan pada plot di bawah ini.51Figure 42:Menggunakan plot kita dapat melakukan beberapa observasi:• Tiga variabel (ID_13, ID_21 dan ID_40) memiliki yang kenaikan statisticterbaik (karena mereka yang tampak) dan mereka juga memiliki changeFold minimal 1.5.• Cabang pertama (menghitung dari atas) adalah pengelompokan hirarkisyang membagi Sampel menjadi dua kelompok; "Placebo" dan "Obat 1 danDrug2". Kedua cabang membagi "Obat 1 dan Obat 2" cluster menjadi"obat 1" dan "Obat 2". ini adalah harapan kita karena telah menggunakanuji statistik untuk mengidentikasi variabel yang benar-benar paling terpisah pada "Placebo" dari "Obat 1 Obat 2".• Dari pengaturan, kita dapat menyimpulkan misalnya bahwa ID_21 variabel memiliki nilai tinggi untuk sampel pada kelompok "Obat 1" danbahwa ID_13 variabel memiliki nilai rendah untuk semua sampel di kelompok "Placebo". Dengan pengaturan default, warna merah di heatmapmenunjukkan bahwa variabel memiliki nilai tinggi untuk sampel itu danhijau menunjukkan bahwa variabel memiliki nilai rendah untuk sampelitu.• Pilih Box Label di tab View. Label variabel sesuai dengan variabel Annotation "Symbol".• Pilih tab View dan Order variabel menurut Change fold• Pilih tab View dan variabel Warna menurut Change fold.• Pilih tab View dan sample Warna untuk semua Annotation. "Pilih Semua"52Figure 43:Salah satu kunci dalam penggunaan QOE adalah bahwa hal itu akan sangat mudah untuk mengubah analisa jalan. Untuk memberikan contoh tentanghal ini pilih Window Sample dan pilih "Treatment" anotasi. Kemudian hapus"Obat 2" kotak centang kelompok. Ini menghapus semua sampel untuk yang"Treatment" Annotation sama dengan "Obat 2", dan update hasil yang sesuai.Hasilnya update segera disajikan, lihat gambar di bawah. Hasilnya adalah ujistatistic yang diperbarui menemukan variabel yang paling memisahkan "Placebo"dari "Obat 1".Dengan pengaturan yang sama dalam statistik dialog lebih variabel (4)sekarang menemukan yang cocok dengan kriteria tes sebelumnya dipilih.Ini akan memberi Anda plot berikut. Ini berisi banyak informasi. Berbagaicara untuk mengubah pewarnaan, pelabelan dan memesan memberikan eksibilitas yang luas untuk menyesuaikan plot dengan kebutuhan Anda.Color Legend menunjukkan skala warna untuk variabel yang berwarna sesuaidengan Fold Change. Sebagai contoh, kita mengamati bahwa variabel dengan"Symbol" nama MYO1B memiliki Fold Change tertinggi. Juga mengamatikarena kami telah bekerja dengan dua tes sisi Perubahan pengaturan Lipat dari1,5 berlaku untuk kedua arah, yaitu plus 1,5 dan -1,5.Ada banyak jenis plot yang sekarang dapat digunakan untuk memberikanwawasan lebih dalam Temuan seperti Kaplan-Meier jika data termasuk informasi survival, kotak plot untuk memberikan informasi rinci tentang bagaimanavariabel bervariasi dari sub-kelompok yang berbeda dan bar rencana untukmemvisualisasikan data setelah beberapa Annotation seperti waktu dan pengobatan.Ada banyak cara untuk menyimpan hasil yang diperoleh:• Log fungsi dalam Log Dock windows dapat digunakan, pilihan lain adalah53Figure 44:untuk memilih File> Export>Gambar untuk di ekspor.Hal ini juga memungkinkan untuk menyimpan daftar variabel, yang adalah apayang akan kita menunjukkan di bawah:• Pilih Window Variable.• Daftar Search khusus itu dibuat ketika kumpulan data pertama dimuat.Daftar Search Termasuk dari hasil pencarian terakhir dilakukan.• Daftar kedua adalah Active list. Ada satu Active list untuk setiap set datayang terbuka. Active list itu memiliki nama yang sama dengan kumpulanFigure 45:54Figure 46:data. Dalam Variable List Table semua variabel terbuka tercantum daftar. Selain Search List dan Active List tabel ini dapat berisi daftar yangdiimpor secara manual, atau daftar yang dihasilkan dengan browser GOatau yang diekspor dari GSEA Workbench.Active list mencakup semua variabel yang aktif dalam satu set data. Sekarangdaftar 4 mencakup variabel yang sesuai uji statistik yang dilakukan. Mengubahslider p-value dalam Statistik Windows dan mengamati bagaimana daftar inidiperbarui untuk menyertakan lebih sedikit atau variable lebih. Sebelum menyimpan daftar, hal ini berguna untuk mengisi dengan informasi yang relevan.• Membuat salinan dari Active List.• Gunakan Select Kolom tombol dan menambahkan kolom yang menarik.Pilih "p- value "," q-value "dan" Symbol "dari daftar. Kolom ini kemudianditambahkan ke Daftar.• Dalam Variable informasi Daftar bagian dari tab Variable ada dua elemeninformasi: Variabel properties List dan Komentar. Kamu bisa menambahinformasi anda mengenai daftar di Komentar lapangan.Daftar Variable bidang properti akan mencakup informasi tentang bagaimanadaftar diciptakan. Di bawah ini kita bisa melihat bahwa misalnya daftar diciptakan menggunakan Dua perbandingan kelompok dan yang 8 sampel dari 12aktif• Pilih icon save, masukkan nama le dan lokasi untuk menyimpan le.Langkah selanjutnya adalah untuk memutuskan apa yang akan dimasukkan dalam daftar.Dalam dialog Export Variabel List Anda akan disajikan dengan beberapa pilihan, seperti cara untuk menyimpan hanya variabel aktif atau semua variabel,55dan apakah akan menyertakan Annotation atau tidak. Catatan: Nilai-nilai perhitungan statistik untuk variable di dalam daftar variabel diperbarui secaradinamis ketika input berubah.Variabel daftar sekarang disimpan dan itu termasuk dengan 4 baris informasi. Sebagai Variabel ID, "Simbol", p-value dan q-value. File ini adalah table teks yang terpisah dengan informasi tentang bagaimana daftar itu dibuatdan Anda dapat membukanya menggunakan program Spreadsheet atau editorteks biasa.Jika Anda membutuhkan le teks biasa tanpa komentar menggunakan "textPlain format le" pilihan dalam Simpan dialog. Tip: Cobalah beberapa pilihanyang berbeda dan membuka le yang disimpan dalam spreadsheet program ataueditor lalu memeriksa hasil.Pada bagian ini kita telah melakukan uji statistik (t-test + Lipat Perubahanltering) dan menampilkan hasil menggunakan Heatmap. Selama analisis, satukelompok sampel terpilih dan bekerja terus pada subset dari data. Akhirnyahasilnya disimpan dalam daftar variabel.4.1.5 Data set eksplorasiPada bagian ini kita akan menunjukkan bagaimana pendekatan satu set databaru dan bagaimana cara memahami informasi tentang data set termasuk menggunakan sistem informasi biologi.• Eksplorasi dasarQOE sangat cocok untuk menyelidiki dan menjelajahi satu set data. Jenispekerjaan ini sering juga disebut data mining atau generate hipotesis. Penggunamencari hal-hal yang baru dalam dataset dengan kecepatan dan interaktivitasdidukung dengan komponen penting yang mendukung jenis pekerjaan. Untukbagian ini kumpulan data Acute Lymphoblastic Leukemia akan digunakan sebagai contoh.• Buka data Acute Lymphoblastic Leukemia dengan selecting Help -> Example Files -> Acute Lymphoblastic Leukemia.gedataBahkan ketika kita memutar gambar ini (pilih Move fungsi dalam Toolbox)sangat sulit untuk membedakan struktur atau pola dalam plot. Alasan untuk iniadalah bahwa semua 22282 gen (variabel) terlibat dalam analisis. Kebanyakandari mereka memiliki kemungkinan yang sangat kecil untuk melakukan variasigenetik yang berbeda dengan yang kita simpulkan, tapi semua dari merekaberkontribusi dengan ramainya data dalam uktuasi kecil. Pada titik ini skorproyeksi akan mendukung secara analisis, lihat gambar di bawah. Rata rataproyeksi adalah 0,41 dan tingkat diindikasikan sebagai hijau. Rata proyeksiakan menginformasikan kepada kami tentang seberapa baik 3 dimensi PCA plotmewakili kumpulan data. Kita bisa meningkatkan tampilan dengan memilih genyang berkontribusi paling besar terhadap Variasi set data dan membuang genyang hanya menunjukkan variasi kecil (mungkin acak) pada uktuasi.56Figure 47:Figure 48:• Pindahkan Filter by Variance Slider di Statistik Windows dan temukanpengaturan dengan skor proyeksi tertinggi (0,43). Hal ini dapat dilakukandengan menyeret slider dengan mouse.Hanya gen standar yang memiliki deviasi lebih dari (atau sama dengan)39,5% dari Varians. Gen terbesar yang memiliki deviasi standar di atas sampelsekarang ikut terlibat dalam analisis. Hal ini terjadi untuk menepati 385 variabel(gen) yang dapat terlihat di Status Bar, di mana ia menunjukkan bahwa hanya385 dari 22.282 variabel (gen) saat ini terlibat dalam analisis. Pola sekarangjelas terlihat di Plot WindowsDengan menggunakan PCA satu, memastikan bahwa pasien yang menyerupai ekspresi gen prol jatuh di dekat satu sama lain dalam plot.Sebagai catatan, ingat bahwa setiap saat Anda menganalisa dari kumpulan data dapat menggunakan Window Log untuk membuat poin Log. Denganmemilih Log yang dibuat sebelumnya, Anda dapat kembali ke titik itu dalamanalisa. Anda juga dapat mengekspor (dan impor) Log poin sehingga Anda dilain waktu dapat kembali menelusuri seluruh analisis.Kita sekarang kembali ke analisa yang sedang berlangsung.Seperti yang bisa dilihat di plot sampel PCA, komponen utama pertama57Figure 49:Figure 50:berisi 22% dari total varians dan jelas membedakan kelompok baru dari sisasubtype yang ada.Agar lebih jelas memahami struktur ketika plotting subtipe lain, kita sekarangakan menghapus grup baru dari PCA-analisis.Pertama kita perlu membuat sampel Annotation baru dengan beberapa nilai:• Pilih New Anotasi icon di dalam Sample Value panel di dalam SampleWindow dock.• Pilih New Value icon dua kali• Pastikan bahwa "New Sample (2) group" dipilih dalam Sample panel• Pilih Anotasi dan lingkaran kelompok searah jarum jam baru, Setelahlingkaran tertutup akan tampil seperti di bawah ini.58Figure 51:Figure 52:• Hapus centang pada kotak centang yang sesuai untuk New Value 2 dalamtabel Sample Value di Windows Sampel Dock PCA segera menghitungulang dan memiliki plot berikut. Juga mencatat bahwa rata proyeksidihitung ulang karena jumlah sampel berubah.Perhatikan bahwa kita sekarang memiliki 118 dari 132 sampel muncul dalamplot. Teks 118/132 Sampel ditampilkan dalam Status Bar bersama dengan teks288/22282 Variabel.Beberapa kelompok sekarang terlihat jelas dan kita bisa melanjutkan prosespembuatan nilai Anotasi baru, keterangan kelompok diidentikasi dari sampel,hapus mereka dari plot yang berpotensi menyesuaikan nilai proyeksi.Selama eksplorasi ini kita telah menggunakan PCA yang dikombinasikandengan varians lter untuk mengidentikasi subkelompok potensial.Dari plot PCA kita lihat 5-6 kelompok potensial. Mari kita terapkan pengelompokan dan mencari 5 kelompok, untuk melihat metode apa yang tidak59Figure 53:Figure 54:Lima kelompok potensial telah diidentikasi. Siluet Plot digunakan untuk menilai kualitas pengelompokan. Nilai siluet positif menunjukkan bahwa sampeldekat dengan sampel yang lain dan dalam kelompok yang sama. plot siluetkongurasi khusus dari Bar plot.memberika pengawasan.Clustering dikendalikan dari tab Cluster. Masukkan 5 dan tekan Run.Hasilnya akan menunjukan sebagai Contoh Annotation baru. Ini disebut"k-means 5" setelah metode dan nomor dipilih oleh cluster.Lihat di Panel Sampel.Setelah plot PCA telah diwarnai sesuai dengan Sampel Annotation baruakan terlihat seperti di bawah ini.4.1.6 Apa yang dimaksud dengan t-test dan Kapan saya harus menggunakannya?Sebuah (dua sampel) t-test dirancang untuk membandingkan nilai rata-rata darivariabel antara dua populasi. T-test umumnya digunakan dalam banyak situasipraktis dan, meskipun keabsahannya tergantung pada beberapa asumsi yangmendasari, sering cukup kuat untuk penyimpangan dari ini. Secara khusus inibenar jika jumlah sampel besar dan merata antara dua kelompok sampel.T-test mengasumsikan bahwa sampel dikumpulkan secara independen. Jika,60misalnya, semua sampel dari satu populasi diambil dari subjek yang sama, varians dapat diremehkan serius yang mengarah ke kesimpulan cacat. Anda dapat secara umum tidak menguji atau benar untuk ini setelah data yang telahdikumpulkan.Asumsi lain yang mendasari t-test adalah bahwa variabel terdistribusi secaranormal di setiap populasi. Namun, untuk ukuran kelompok sampel yang besar(lebih dari, katakanlah, 20-30 pengamatan per kelompok), asumsi ini tidak kritisdan juga untuk kelompok sampel kecil ukuran t-test sering cukup kuat terhadappenyimpangan dari normalitas. Anda dapat memeriksa asumsi normalitas grasdi Qlucore omics Explorer menggunakan kotak plot, yang harus simetris (yaitu,dengan median sekitar di tengah kotak, dengan kumis sekitar sama panjang disetiap sisi). Sayangnya, hal itu bisa sulit untuk mengatakan dari satu set kecilsampel apakah asumsi normalitas puas atau tidak (dan jika kita memiliki banyaksampel, kita melihat bahwa asumsi tidak mungkin yang penting). Kemungkinan lain adalah dengan menggunakan pengalaman sebelumnya, yang mungkinmenunjukkan bahwa variabel yang dipertimbangkan kemungkinan akan sekitarterdistribusi normal. Kekokohan t-test juga tergantung pada ukuran kelompok sampel relatif dalam kumpulan data kami dan apakah varians adalah samaantara dua populasi. T-test digunakan oleh Qlucore omics Explorer mengasumsikan varians sama antara populasi. Asumsi ini dapat diperiksa secara grasmenggunakan plot pencar variabel. Jika jumlah sampel pada kedua kelompokadalah sama, t-test ini cukup kuat terhadap pelanggaran asumsi ini. Melihatangka pada bagian ANOVA bawah untuk ilustrasi tentang bagaimana untukmemeriksa asumsi normalitas dan kesetaraan varians gras, menggunakan alatyang disediakan dalam Qlucore omics Explorer.Jika data menunjukkan cukup non-normalitas dan / atau ketimpangan varians, transformasi mungkin berguna. Misalnya, jika nilai-nilai yang miring kekanan, transformasi logaritmik dapat memberikan distribusi yang lebih dekatdengan normal. Salah satu contoh dari hal ini adalah data ekspresi gen yangdiperoleh dari microarray, yang sering diasumsikan mengikuti distribusi normal setelah transformasi logaritmik. Satu harus, bagaimanapun, perhatikanbahwa transformasi mengubah skala nilai-nilai dan mungkin dalam beberapakasus membuat hasil yang lebih sulit untuk menafsirkan. A dipasangkan ttest digunakan ketika data datang berpasangan, misalnya, jika masing-masingsubjek telah diberikan baik dari dua perlakuan dibandingkan. Menerapkan dipasangkan t-test dapat meningkatkan kekuatan untuk mendeteksi perbedaanantara kelompok dengan akuntansi untuk perbedaan antara individu.4.1.7 Memanfaatkan informasi biologi System (GSEA dan GO)Analisis jalur, atau analisis set gen, adalah nama kolektif untuk metode yangbertujuan untuk analisis statistik dari kumpulan gen, bukan gen tunggal, dalamsatu set data yang diberikan. Biasanya, gen dikelompokkan bersama dalamkoleksi (atau satu set gen) jika mereka memiliki sesuatu yang sama, misalnya,jika mereka adalah bagian dari jalur biologis yang sama atau jika mereka semuaterletak dekat satu sama lain di sepanjang genom.61Figure 55:Untuk melakukan jalur (set gen) analisis, dua komponen yang diperlukan:kumpulan data, dan satu atau beberapa set gen yang telah ditetapkan (yaitu,set gen tidak harus didenisikan berdasarkan nilai-nilai dalam kumpulan data).Gen set denisi sering diperoleh dari repositori online terbuka seperti mSigDBdan Reactome, atau dari produk komersial khusus menyediakan informasi jalurcurated secara manual.Kami sejauh ini hanya digunakan isi dari le data (termasuk penjelasan)untuk melakukan analisis data percobaan. Qlucore juga menawarkan mejakerja GSEA sebagai alat untuk menganalisis hasil dari uji statistik dalam konteks daftar lain (gen set). Baca lebih lanjut tentang GSEA sebagai metodedalam Subramanian, Tamayo, dkk. 2005 Proc Natl Acad Sci U S A 102 (43):15.545-50.Untuk menunjukkan GSEA Workbench dan GO-browser yang kita akan mulai kembali analisis:• Tutup semua data yang terbuka pada QOE• Buka data akut Lymphoblastic Leukemia dibuka dari Help > ExampleFilesSet contoh gen tersedia di QOE dibangun sekitar Simbol Gene sebagai identi-kasi unik untuk gen sedangkan kumpulan data Leukemia kita telah menggunakan sejauh ini didasarkan pada ID probeset (Aymetrix) sebagai identikasiunik untuk setiap variabel (gen). Perbandingan tanpa mengambil ini ke rekening akan memberikan nol pertandingan antara dua sumber informasi.Pilih tab Data dan kotak Identier. Ubah Identier Variabel untuk "GeneSymbol". Perhatikan bagaimana dua kolom, untuk daftar aktif, dalam daftarvariabel panel diperbarui untuk mencerminkan perubahan identier. Kolompertama adalah jumlah elemen yang unik (Simbol Gene) dalam kumpulan datadan kolom kedua adalah jumlah pertandingan. Karena kita tidak melakukanpenyaringan atau seleksi jumlah pertandingan sama dengan jumlah probe setdalam kumpulan data (22.282).Untuk mendapatkan variabel yang unik untuk setiap Gene Simbol kita perluruntuh variabel yang memiliki satu atau lebih pemeriksaan set terpasang. Pilihruntuh berdasarkan rata-rata di drop down box di samping pemilihan identier62Figure 56:Pengayaan Skor dihitung untuk semua set gen dan daftar hasil di tengah diperintahkan sesuai dengan Skor Pengayaan.Variabel. Data diperbarui set belum termasuk 13.262 variabel yang masingmasing dari mereka cocok dengan Gene Symbol.Mulai GSEA Workbench (Lihat menu). Sebuah jendela baru akan terbuka.QUOTE dikirim dengan tiga contoh set gen untuk tujuan demonstrasi. KetikaGSEA Workbench dimulai itu membuat salinan data di set aktif data. Pengaturan statistik yang relevan juga disalin dari dialog Statistik.Catatan: KarenaGSEA Workbench bekerja dengan salinan data membuat Anda dapat terusbekerja dan menganalisis data Anda diatur dalam QOE Main Window.Jika Anda menggunakan pengaturan default Anda akan melihat layar sepertidi bawah ini. Sekarang mengubah pengaturan sesuai dengan langkah-langkahberikut.• Pastikan kedua Sets Qlucore Uji Gene dipilih• Mengubah Metric menjadi SNR pada Leukemia Subtipe dan kelompokE2A-PBX1.• Tekan Run untuk memulai perhitungan skor Pengayaan.Daftar pertama, yang disebut E2A-PBX memiliki tertinggi Normalized skorPengayaan (2.06). Grak ke kanan menunjukkan hasil. Sejak metrik dipilihuntuk peringkat data diatur sesuai dengan SNR untuk E2A-PBX1 itu bukankejutan besar bahwa kita mendapatkan plot yang sangat jelas untuk daftarcontoh gen yang disebut E2A-PBX1.• Tekan daftar nr 1. Anda akan mendapatkan hasil seperti di bawah ini.63Figure 57:Figure 58:Sebuah panduan umum untuk interpretasi adalah bahwa data membuatAnda menganalisa, berdasarkan metrik yang dipilih, menunjukkan tingkat tertinggi kesamaan dengan daftar gen set dengan skor Pengayaan tertinggi.• Pilih daftar kedua dalam tabel, yaitu chr22.Ini akan memberikan plot yang lebih normal menunjukkan bagaimana skor tumbuh hingga skor Pengayaan 0,28.Ada dua pilihan Ekspor:• Daftar: Akan mengekspor isi dari daftar gen set yang dipilih untuk QOE.Daftar akan terlihat dalam Variable Daftar Tabel.• Hasil: Akan mengekspor semua plot dan daftar hasil ke folder pilihanAnda.Tutup GSEA Workbench untuk mempersiapkan langkah berikutnya644.1.8 GO BrowserUntuk menunjukkan bagaimana sistem informasi biologi seperti ontologi gendapat meningkatkan analisis kami akan memulai GO Browser. Anda dapatmenggunakan berbagai ontologi dan asosiasi le sebagai input. Secara default,generik ontologi GO Slim dan le Gene Asosiasi manusia disertakan. Untuk versiterbaru dan untuk ontologi lainnya mengunjungi www.geneontology.org14. File-le ini diperbarui terus menerus dan hasil dalam contoh di bawah ini mungkinberbeda dari apa yang Anda alami melakukan langkah-langkah menggunakanle yang lebih baru.• Hapus tanda centang pada "T-ALL" kelompok dalam panel Sampel.• Dalam lter dialog statistik Multi Grup Perbandingan dan Leukemia subtipe• Ubah ke plot PCA Variabel• Filter untuk p-nilai 1e-15. Ini akan memberi Anda 345 variabel aktif.• Mulai GO Browser dari View> GO Browser15.Mencari "kinase" di jendela GO Browser. Kami hanya memiliki satu hit,GO: 0016301, yang merupakan kategori sub dari molekul fungsi ontologi (GO:0003674). Dengan memilih berturut-turut dalam daftar hasil pencarian kontendari kategori yang ditampilkan di jendela kanan atas.Dengan memilih berturut-turut dalam daftar hasil pencarian konten darikategori yang ditampilkan di jendela kanan atas.Periksa kotak centang di sebelah kanan istilah GO (GO: 0016301). Andasekarang akan melihat 180 gen yang cocok dengan istilah yang dipilih ditampilkan di jendela di sebelah kanan bawah. Jendela kanan bawah akan menunjukkan jumlah semua persyaratan yang dipilih. Gen-gen ini dapat diekspor keQlucore omics Explorer Daftar Variabel Tabel antarmuka.• Tekan tombol Ekspor untuk mengekspor daftar.• Hapus tanda centang GO: 0016301 dan periksa GO: 0003674• Tekan tombol Ekspor lagiBeralih ke QoE jendela utama. Sekarang Anda akan melihat dua daftar barudi Variable Daftar Tabel nama sesuai dengan istilah pencarian GO.Kolom kedua di Variable Daftar Tabel diaktifkan opsi untuk variabel warnasesuai dengan setiap daftar.• Tekan kotak warna untuk daftar pertama dan kemudian tekan daftarwarna untuk daftar kedua.Note: The rst GO list includes 119 unique items which matches precisely 93genes in this specic data set whereas the second list includes 685 items whichmatches 375 genes.65Figure 59:Figure 60:66Figure 61:Catatan: Variabel memberi warna juga pada peta panas dan plot pencar.Plot akan terlihat seperti sesuatu seperti di bawah ini, di mana semuagen termasuk dalam daftar GO function_GO_0003674 molekul berwarna ungudan gen dalam daftar GO_mf_kinase_activity_GO_0016301 berwarna kuning. Jika daftar mendapat warna dengan diagonal dalam kotak warna itu berartibahwa daftar yang tumpang tindih. Daftar terakhir digunakan untuk mewarnaiakan menang.Model pekerjaan ini adalah cara terbaik untuk menggabungkan sistem informasi biologi dari daftar yang berbeda dengan kesimpulan dari studi yang sedangberlangsung. Hal ini dimungkinkan untuk mewarnai plot variabel ke sejumlahdaftar.Untuk mempelajari variabel termasuk dalam daftar berdasarkan dua genontologi itu mudah.• Pada Variable Daftar Tabel memeriksa kolom pertama untuk dua daftar.Plot akan diperbarui dan hanya mencakup gen berwarna kuning dan ungu, akanada 15 variabel yang aktif.Alat tikus alat warna juga ampuh untuk memahami lebih lanjut tentangdata. Untuk menggambarkan hal ini lebih lanjut membuka disinkronkan sampelPCA petak (Windows> New Synchronized Plot) dan kemudian pilih untuk ubin(Windows> Tile)67Figure 62:Figure 63:• Pilih Warna di Tool Box (tidak ada multi-). Pastikan bahwa plot SampelPCA aktif dan kemudian pilih (dalam Jendela Variable) variabel dalamvariabel PCA petakAnda sekarang mendapatkan Sampel berwarna sesuai dengan tingkat ekspresi untuk gen yang dipilih untuk masing-masing sampel. Pada contoh dibawah Anda amati bahwa data sampel berwarna.Dengan memilih variabel yang berbeda (satu per satu) baik dalam plot PCAvariabel atau dalam daftar variabel satu melihat tingkat ekspresi gen yang dipilih untuk setiap pasien.Sekarang kita akan menemukan gen yang berhubungan dengan gen tertentu.Kami memilih PBX1 gen.• Gunakan alat pencarian untuk menemukan gen PBX1. Pilih tombol danmasukkan PBX1 dalam dialog pencarian ketika Anda mencari di "GeneSymbol" penjelasan.• Select Corr. in the Tool Box68Figure 64:Figure 65:69Figure 66:• Tekan daftar pencarian di Variable Table View. Gen PBX1 akan ditambahkan ke plot PCA variabel dan akan ditandai.• Dalam Box Variabel Korelasi Anda sekarang dapat memilih tingkat korelasi dan jika Anda ingin memasukkan korelasi positif dan negatif.• Pilih 60% dan korelasi positifDalam Window Plot Variable, Anda sekarang dapat melihat bahwa semua variabel yang memiliki korelasi lebih dari 60% dengan PBX1 terhubung dengangaris. Semua variabel aktif lainnya juga hadir. Untuk hanya melihat variabelberkorelasi memindahkan slider varians ke kanan.70Figure 67:71Figure 68:Sebuah variabel yang mendekati normal didistribusikan dalam setiap kelompoksampel.4.1.9 Apa itu ANOVA dan Kapan saya harus menggunakannya?ANOVA (analisis varians) adalah generalisasi dari t-tes, yang memungkinkanperbandingan lebih dari dua populasi berarti. Kami juga dapat meminta beberapa prediktor dan mengambil kovariat ke rekening. Dua sisi t-test identikdengan apa yang disebut satu-way ANOVA (ANOVA dengan satu prediktor) dimana prediktor yang memiliki dua kategori. Ketika membandingkan nilai ratarata lebih dari dua kelompok, hipotesis nol bahwa semua mean populasi adalahsama, dan hipotesis alternatif adalah bahwa setidaknya satu berarti berbedadari yang lain. Oleh karena itu, ANOVA tidak segera memberitahu kami yangberarti yang berbeda. Selain itu, diarahkan (satu sisi) tes tidak masuk akalketika lebih dari dua cara dibandingkan. Untuk gambaran yang lebih komprehensif dari model ANOVA yang berbeda, lihat dokumen "Cara menggunakanANOVA" yang tersedia dari www.qlucore.com.Sebagai generalisasi dari t-test, ANOVA dibangun pada asumsi yang samakemerdekaan dalam kelompok, normalitas dan kesetaraan varians. Adapunt-test, ANOVA cukup kuat melawan penyimpangan, terutama untuk ukurankelompok yang sama (dan nomor lebih besar dari sampel). Gambar 1 dan 2menunjukkan bagaimana asumsi normalitas dan kesetaraan varians dapat grasdiperiksa dalam Qlucore omics Explorer.4.1.10 Kapan harus menggunakan Penyaringan Varian?Varians penyaringan dapat digunakan sebagai cara untuk mengurangi jumlahvariabel dalam satu set data dalam cara yang tanpa pengawasan (yaitu, tanpa72Figure 69:Sebuah variabel yang menunjukkan varians yang sama (tapi cara yang berbeda)dalam kelompok sampel yang berbeda.menggunakan penjelasan sampel). Dengan teknik eksperimental saat ini sangat mudah untuk mengumpulkan data untuk sejumlah besar variabel secarabersamaan, dan variabel umumnya tidak secara eksplisit dipilih berdasarkanasumsi sebelumnya dari "interestingness". Oleh karena itu, dapat dibayangkanbahwa sebagian besar variabel menambahkan apa-apa tapi suara untuk analisis dan kami mungkin ingin menghapus variabel ini untuk menjelajahi seluruh data secara lebih rinci. Salah satu cara untuk mengidentikasi variabelyang berpotensi menarik adalah dengan cara varians mereka. Sebuah variabelyang hampir konstan di semua pengamatan memiliki varians yang rendah, dankita dapat menghapus variabel seperti dengan cara slider varians dalam Statistik toolbox. Ini juga telah menyarankan bahwa varians penyaringan mungkinberguna untuk meningkatkan kekuatan mendeteksi gen yang diekspresikan secara berbeda dengan t-tes atau ANOVA. Alasan di balik ini adalah bahwa varians penyaringan mengurangi jumlah variabel dan karena itu membuat koreksiuntuk beberapa pengujian (lihat pembahasan pada q-nilai di atas) kurang penghambat. Jumlah yang sesuai varians ltering sangat bergantung pada kumpulan data dan tujuan analisis. Jika kumpulan data belum pra-disaring sebelumdimuat ke Qlucore omics Explorer, menyaring lebih dari setengah dari variabeldibayangkan. Jika kumpulan data telah pra-disaring, cukup kurang varianspenyaringan mungkin diperlukan.73Figure 70:4.2 PCA plotsArti dasar dari PCA plot data multidimensi di ANTRIAN adalah bahwa titikdata yang mirip juga disajikan berdekatan dalam plot yang dihasilkan. PCAoperasi ditandai dengan tur yang mempertahankan sebanyak informasi awalnya tersedia mungkin dalam dihasilkan plot tiga dimensi. Isi informasi tersebutkemudian diukur dengan varians statistik dalam data ketika menerapkan PCA.Pada gambar di bawah, kelompok kuning terdiri dari sampel yang mirip satusama lain dan yang berbeda dari sampel biru:4.3 Apa arti penting dari statistik plot PCA.PCA operasi ANTRIAN tidak membuat asumsi tentang data Anda. Jika Andadapat melihat struktur dan pola yang terlihat pada layar komputer itu kemudian karena struktur yang hadir. Beberapa metode statistik yang tersedia diQOE (seperti ANOVA) dapat menciptakan pola bahkan dari data acak. Polapola ini kemudian, dengan probabilitas yang sangat tinggi, secara statistik tidakstabil dan Anda harus melihat signikansi statistik dari struktur Anda menemukan. QUE dilengkapi dengan beberapa alat yang tersedia untuk mengendalikan signikansi statistik. Mereka termasuk lintas validasi (meninggalkansatu atau beberapa sampel data keluar), pengacakan atau tes permutasi. QOEjuga menyediakan p-nilai dan nilai-nilai q untuk metode statistik yang dipilih,sehingga mudah untuk memeriksa dinamis signikansi statistik dari strukturAnda menemukan.744.3.1 Bisakah PCA melewatkan struktur dan pola?PCA operasi digunakan untuk mengurangi dimensi dan karenanya ada padaumumnya hilangnya informasi dalam presentasi tiga dimensi. PCA operasi tetapadalah stabil dan dalam metode optimal arti tertentu untuk pengurangan dimensi dan dengan menggunakan eksibilitas fungsi Dinamis PCA di QOE Andameminimalkan risiko hilang struktur penting. Penggunaan grak dan metodenonlinear seperti ISOMAP tersedia di QOE juga merupakan cara untuk meminimalkan risiko hilang informasi penting mengenai data Anda. Pada gambardi bawah Anda dapat misalnya, dengan menggunakan grak, melihat bahwakelompok hijau sebenarnya terdiri dari dua subkelompok yang berbeda. Faktaini akan sulit untuk membedakan tanpa dukungan dari grak hadir dalam plot.75Bab 55 Penutup5.1 KesimpulanDari Paparan atau penjelasan di atas, maka penulis dapat menyimpulkan bahwasesuai dengan makalah Correlation Matrix Heatmap kami denisikan tentaginteraksi secara terus menerus antara beberapa variable dan menjadi jalur padaanalisis dan static yang dapat di tampilkan secara grapic. Dan memahamicara menggunakan software Qlucore Omics Explorer, instalasi dan menambahpemahaman dengan contoh kasus pada penulisan ini dalam penerapan konsepdi atas.5.2 SaranMenyadari bahwa penulis masih jauh dari kata sempurna, kedepannya penulisakan lebih fokus dan details dalam menjelaskan tentang makalah di atas dengan sumber  sumber yang lebih banyak yang tentunga dapat di pertanggungjawabkan.76Daftar Pustaka• https://en.wikipedia.org/wiki/Heat_map• https://en.wikipedia.org/wiki/Cormac_Kinney• https://en.wikipedia.org/wiki/Qlucore• http://www2.warwick.ac.uk/fac/sci/moac/people/students/peter_cock/r/heatmap• http://blogs.sas.com/content/sasdummy/2013/06/12/correlations-matrixheatmap-with-sas/• www.cs.uic.edu/~wilkinson/Publications/heatmap.pdf• http://www.mathworks.com/help/bioinfo/ref/heatmap.html?requestedDomain=www.mathworks.com• https://labescape.com/info/about-heat-maps• https://www.logianalytics.com/resources/bi-encyclopedia/heat-maps/• http://www.fusioncharts.com/chart-primers/heat-map-chart/• http://www.qlucore.com/77<


RECENT POSTS:
SEARCH BY TAGS:
No tags yet.
bottom of page