TY - JOUR
A1 - Birnick, Johann
A1 - Bläsius, Thomas
A1 - Friedrich, Tobias
A1 - Naumann, Felix
A1 - Papenbrock, Thorsten
A1 - Schirneck, Friedrich Martin
T1 - Hitting set enumeration with partial information for unique column combination discovery
JF - Proceedings of the VLDB Endowment
N2 - Unique column combinations (UCCs) are a fundamental concept in relational databases. They identify entities in the data and support various data management activities. Still, UCCs are usually not explicitly defined and need to be discovered. State-of-the-art data profiling algorithms are able to efficiently discover UCCs in moderately sized datasets, but they tend to fail on large and, in particular, on wide datasets due to run time and memory limitations.
In this paper, we introduce HPIValid, a novel UCC discovery algorithm that implements a faster and more resource-saving search strategy. HPIValid models the metadata discovery as a hitting set enumeration problem in hypergraphs. In this way, it combines efficient discovery techniques from data profiling research with the most recent theoretical insights into enumeration algorithms. Our evaluation shows that HPIValid is not only orders of magnitude faster than related work, it also has a much smaller memory footprint.
Y1 - 2020
U6 - https://doi.org/10.14778/3407790.3407824
SN - 2150-8097
VL - 13
IS - 11
SP - 2270
EP - 2283
PB - Association for Computing Machinery
CY - [New York, NY]
ER -
TY - JOUR
A1 - Jiang, Lan
A1 - Naumann, Felix
T1 - Holistic primary key and foreign key detection
JF - Journal of intelligent information systems : JIIS
N2 - Primary keys (PKs) and foreign keys (FKs) are important elements of relational schemata in various applications, such as query optimization and data integration. However, in many cases, these constraints are unknown or not documented. Detecting them manually is time-consuming and even infeasible in large-scale datasets. We study the problem of discovering primary keys and foreign keys automatically and propose an algorithm to detect both, namely Holistic Primary Key and Foreign Key Detection (HoPF). PKs and FKs are subsets of the sets of unique column combinations (UCCs) and inclusion dependencies (INDs), respectively, for which efficient discovery algorithms are known. Using score functions, our approach is able to effectively extract the true PKs and FKs from the vast sets of valid UCCs and INDs. Several pruning rules are employed to speed up the procedure. We evaluate precision and recall on three benchmarks and two real-world datasets. The results show that our method is able to retrieve on average 88% of all primary keys, and 91% of all foreign keys. We compare the performance of HoPF with two baseline approaches that both assume the existence of primary keys.
KW - Data profiling application
KW - Primary key
KW - Foreign key
KW - Database
KW - management
Y1 - 2019
U6 - https://doi.org/10.1007/s10844-019-00562-z
SN - 0925-9902
SN - 1573-7675
VL - 54
IS - 3
SP - 439
EP - 461
PB - Springer
CY - Dordrecht
ER -
TY - JOUR
A1 - Bonifati, Angela
A1 - Mior, Michael J.
A1 - Naumann, Felix
A1 - Noack, Nele Sina
T1 - How inclusive are we?
BT - an analysis of gender diversity in database venues
JF - SIGMOD record / Association for Computing Machinery, Special Interest Group on Management of Data
N2 - ACM SIGMOD, VLDB and other database organizations have committed to fostering an inclusive and diverse community, as do many other scientific organizations. Recently, different measures have been taken to advance these goals, especially for underrepresented groups. One possible measure is double-blind reviewing, which aims to hide gender, ethnicity, and other properties of the authors.
We report the preliminary results of a gender diversity analysis of publications of the database community across several peer-reviewed venues, and also compare women's authorship percentages in both single-blind and double-blind venues along the years. We also obtained a cross comparison of the obtained results in data management with other relevant areas in Computer Science.
Y1 - 2022
U6 - https://doi.org/10.1145/3516431.3516438
SN - 0163-5808
SN - 1943-5835
VL - 50
IS - 4
SP - 30
EP - 35
PB - Association for Computing Machinery
CY - New York
ER -
TY - INPR
A1 - Acharya, B. S.
A1 - Actis, M.
A1 - Aghajani, T.
A1 - Agnetta, G.
A1 - Aguilar, J.
A1 - Aharonian, Felix A.
A1 - Ajello, M.
A1 - Akhperjanian, A. G.
A1 - Alcubierre, M.
A1 - Aleksic, J.
A1 - Alfaro, R.
A1 - Aliu, E.
A1 - Allafort, A. J.
A1 - Allan, D.
A1 - Allekotte, I.
A1 - Amato, E.
A1 - Anderson, J.
A1 - Angüner, Ekrem Oǧuzhan
A1 - Antonelli, L. A.
A1 - Antoranz, P.
A1 - Aravantinos, A.
A1 - Arlen, T.
A1 - Armstrong, T.
A1 - Arnaldi, H.
A1 - Arrabito, L.
A1 - Asano, K.
A1 - Ashton, T.
A1 - Asorey, H. G.
A1 - Awane, Y.
A1 - Baba, H.
A1 - Babic, A.
A1 - Baby, N.
A1 - Baehr, J.
A1 - Bais, A.
A1 - Baixeras, C.
A1 - Bajtlik, S.
A1 - Balbo, M.
A1 - Balis, D.
A1 - Balkowski, C.
A1 - Bamba, A.
A1 - Bandiera, R.
A1 - Barber, A.
A1 - Barbier, C.
A1 - Barcelo, M.
A1 - Barnacka, Anna
A1 - Barnstedt, Jürgen
A1 - Barres de Almeida, U.
A1 - Barrio, J. A.
A1 - Basili, A.
A1 - Basso, S.
A1 - Bastieri, D.
A1 - Bauer, C.
A1 - Baushev, Anton N.
A1 - Becerra Gonzalez, J.
A1 - Becherini, Yvonne
A1 - Bechtol, K. C.
A1 - Tjus, J. Becker
A1 - Beckmann, Volker
A1 - Bednarek, W.
A1 - Behera, B.
A1 - Belluso, M.
A1 - Benbow, W.
A1 - Berdugo, J.
A1 - Berger, K.
A1 - Bernard, F.
A1 - Bernardino, T.
A1 - Bernlöhr, K.
A1 - Bhat, N.
A1 - Bhattacharyya, S.
A1 - Bigongiari, C.
A1 - Biland, A.
A1 - Billotta, S.
A1 - Bird, T.
A1 - Birsin, E.
A1 - Bissaldi, E.
A1 - Biteau, Jonathan
A1 - Bitossi, M.
A1 - Blake, S.
A1 - Blanch Bigas, O.
A1 - Blasi, P.
A1 - Bobkov, A. A.
A1 - Boccone, V.
A1 - Boettcher, Markus
A1 - Bogacz, L.
A1 - Bogart, J.
A1 - Bogdan, M.
A1 - Boisson, Catherine
A1 - Boix Gargallo, J.
A1 - Bolmont, J.
A1 - Bonanno, G.
A1 - Bonardi, A.
A1 - Bonev, T.
A1 - Bonifacio, P.
A1 - Bonnoli, G.
A1 - Bordas, Pol
A1 - Borgland, A. W.
A1 - Borkowski, Janett
A1 - Bose, R.
A1 - Botner, O.
A1 - Bottani, A.
A1 - Bouchet, L.
A1 - Bourgeat, M.
A1 - Boutonnet, C.
A1 - Bouvier, A.
A1 - Brau-Nogue, S.
A1 - Braun, I.
A1 - Bretz, T.
A1 - Briggs, M. S.
A1 - Bringmann, T.
A1 - Brook, P.
A1 - Brun, Pierre
A1 - Brunetti, L.
A1 - Buanes, T.
A1 - Buckley, J. H.
A1 - Buehler, R.
A1 - Bugaev, V.
A1 - Bulgarelli, A.
A1 - Bulik, Tomasz
A1 - Busetto, G.
A1 - Buson, S.
A1 - Byrum, K.
A1 - Cailles, M.
A1 - Cameron, R. A.
A1 - Camprecios, J.
A1 - Canestrari, R.
A1 - Cantu, S.
A1 - Capalbi, M.
A1 - Caraveo, P. A.
A1 - Carmona, E.
A1 - Carosi, A.
A1 - Carr, John
A1 - Carton, P. H.
A1 - Casanova, Sabrina
A1 - Casiraghi, M.
A1 - Catalano, O.
A1 - Cavazzani, S.
A1 - Cazaux, S.
A1 - Cerruti, M.
A1 - Chabanne, E.
A1 - Chadwick, Paula M.
A1 - Champion, C.
A1 - Chen, Andrew
A1 - Chiang, J.
A1 - Chiappetti, L.
A1 - Chikawa, M.
A1 - Chitnis, V. R.
A1 - Chollet, F.
A1 - Chudoba, J.
A1 - Cieslar, M.
A1 - Cillis, A. N.
A1 - Cohen-Tanugi, J.
A1 - Colafrancesco, Sergio
A1 - Colin, P.
A1 - Calome, J.
A1 - Colonges, S.
A1 - Compin, M.
A1 - Conconi, P.
A1 - Conforti, V.
A1 - Connaughton, V.
A1 - Conrad, Jan
A1 - Contreras, J. L.
A1 - Coppi, P.
A1 - Corona, P.
A1 - Corti, D.
A1 - Cortina, J.
A1 - Cossio, L.
A1 - Costantini, H.
A1 - Cotter, G.
A1 - Courty, B.
A1 - Couturier, S.
A1 - Covino, S.
A1 - Crimi, G.
A1 - Criswell, S. J.
A1 - Croston, J.
A1 - Cusumano, G.
A1 - Dafonseca, M.
A1 - Dale, O.
A1 - Daniel, M.
A1 - Darling, J.
A1 - Davids, I.
A1 - Dazzi, F.
A1 - De Angelis, A.
A1 - De Caprio, V.
A1 - De Frondat, F.
A1 - de Gouveia Dal Pino, E. M.
A1 - de la Calle, I.
A1 - De La Vega, G. A.
A1 - Lopez, R. de los Reyes
A1 - De Lotto, B.
A1 - De Luca, A.
A1 - de Mello Neto, J. R. T.
A1 - de Naurois, M.
A1 - de Oliveira, Y.
A1 - de Ona Wilhelmi, E.
A1 - de Souza, V.
A1 - Decerprit, G.
A1 - Decock, G.
A1 - Deil, C.
A1 - Delagnes, E.
A1 - Deleglise, G.
A1 - Delgado, C.
A1 - Della Volpe, D.
A1 - Demange, P.
A1 - Depaola, G.
A1 - Dettlaff, A.
A1 - Di Paola, A.
A1 - Di Pierro, F.
A1 - Diaz, C.
A1 - Dick, J.
A1 - Dickherber, R.
A1 - Dickinson, H.
A1 - Diez-Blanco, V.
A1 - Digel, S.
A1 - Dimitrov, D.
A1 - Disset, G.
A1 - Djannati-Ataï, A.
A1 - Doert, M.
A1 - Dohmke, M.
A1 - Domainko, W.
A1 - Prester, Dijana Dominis
A1 - Donat, A.
A1 - Dorner, D.
A1 - Doro, M.
A1 - Dournaux, J-L.
A1 - Drake, G.
A1 - Dravins, D.
A1 - Drury, L.
A1 - Dubois, F.
A1 - Dubois, R.
A1 - Dubus, G.
A1 - Dufour, C.
A1 - Dumas, D.
A1 - Dumm, J.
A1 - Durand, D.
A1 - Dyks, J.
A1 - Dyrda, M.
A1 - Ebr, J.
A1 - Edy, E.
A1 - Egberts, Kathrin
A1 - Eger, P.
A1 - Einecke, S.
A1 - Eleftheriadis, C.
A1 - Elles, S.
A1 - Emmanoulopoulos, D.
A1 - Engelhaupt, D.
A1 - Enomoto, R.
A1 - Ernenwein, J-P
A1 - Errando, M.
A1 - Etchegoyen, A.
A1 - Evans, P.
A1 - Falcone, A.
A1 - Fantinel, D.
A1 - Farakos, K.
A1 - Farnier, C.
A1 - Fasola, G.
A1 - Favill, B.
A1 - Fede, E.
A1 - Federici, S.
A1 - Fegan, S.
A1 - Feinstein, F.
A1 - Ferenc, D.
A1 - Ferrando, P.
A1 - Fesquet, M.
A1 - Fiasson, A.
A1 - Fillin-Martino, E.
A1 - Fink, D.
A1 - Finley, C.
A1 - Finley, J. P.
A1 - Fiorini, M.
A1 - Firpo Curcoll, R.
A1 - Flores, H.
A1 - Florin, D.
A1 - Focke, W.
A1 - Foehr, C.
A1 - Fokitis, E.
A1 - Font, L.
A1 - Fontaine, G.
A1 - Fornasa, M.
A1 - Foerster, A.
A1 - Fortson, L.
A1 - Fouque, N.
A1 - Franckowiak, A.
A1 - Fransson, C.
A1 - Fraser, G.
A1 - Frei, R.
A1 - Albuquerque, I. F. M.
A1 - Fresnillo, L.
A1 - Fruck, C.
A1 - Fujita, Y.
A1 - Fukazawa, Y.
A1 - Fukui, Y.
A1 - Funk, S.
A1 - Gaebele, W.
A1 - Gabici, S.
A1 - Gabriele, R.
A1 - Gadola, A.
A1 - Galante, N.
A1 - Gall, D.
A1 - Gallant, Y.
A1 - Gamez-Garcia, J.
A1 - Garcia, B.
A1 - Garcia Lopez, R.
A1 - Gardiol, D.
A1 - Garrido, D.
A1 - Garrido, L.
A1 - Gascon, D.
A1 - Gaug, M.
A1 - Gaweda, J.
A1 - Gebremedhin, L.
A1 - Geffroy, N.
A1 - Gerard, L.
A1 - Ghedina, A.
A1 - Ghigo, M.
A1 - Giannakaki, E.
A1 - Gianotti, F.
A1 - Giarrusso, S.
A1 - Giavitto, G.
A1 - Giebels, B.
A1 - Gika, V.
A1 - Giommi, P.
A1 - Girard, N.
A1 - Giro, E.
A1 - Giuliani, A.
A1 - Glanzman, T.
A1 - Glicenstein, J. -F.
A1 - Godinovic, N.
A1 - Golev, V.
A1 - Gomez Berisso, M.
A1 - Gomez-Ortega, J.
A1 - Gonzalez, M. M.
A1 - Gonzalez, A.
A1 - Gonzalez, F.
A1 - Gonzalez Munoz, A.
A1 - Gothe, K. S.
A1 - Gougerot, M.
A1 - Graciani, R.
A1 - Grandi, P.
A1 - Granena, F.
A1 - Granot, J.
A1 - Grasseau, G.
A1 - Gredig, R.
A1 - Green, A.
A1 - Greenshaw, T.
A1 - Gregoire, T.
A1 - Grimm, O.
A1 - Grube, J.
A1 - Grudzinska, M.
A1 - Gruev, V.
A1 - Gruenewald, S.
A1 - Grygorczuk, J.
A1 - Guarino, V.
A1 - Gunji, S.
A1 - Gyuk, G.
A1 - Hadasch, D.
A1 - Hagiwara, R.
A1 - Hahn, J.
A1 - Hakansson, N.
A1 - Hallgren, A.
A1 - Hamer Heras, N.
A1 - Hara, S.
A1 - Hardcastle, M. J.
A1 - Harris, J.
A1 - Hassan, T.
A1 - Hatanaka, K.
A1 - Haubold, T.
A1 - Haupt, A.
A1 - Hayakawa, T.
A1 - Hayashida, M.
A1 - Heller, R.
A1 - Henault, F.
A1 - Henri, G.
A1 - Hermann, G.
A1 - Hermel, R.
A1 - Herrero, A.
A1 - Hidaka, N.
A1 - Hinton, J.
A1 - Hoffmann, D.
A1 - Hofmann, W.
A1 - Hofverberg, P.
A1 - Holder, J.
A1 - Horns, D.
A1 - Horville, D.
A1 - Houles, J.
A1 - Hrabovsky, M.
A1 - Hrupec, D.
A1 - Huan, H.
A1 - Huber, B.
A1 - Huet, J. -M.
A1 - Hughes, G.
A1 - Humensky, T. B.
A1 - Huovelin, J.
A1 - Ibarra, A.
A1 - Illa, J. M.
A1 - Impiombato, D.
A1 - Incorvaia, S.
A1 - Inoue, S.
A1 - Inoue, Y.
A1 - Ioka, K.
A1 - Ismailova, E.
A1 - Jablonski, C.
A1 - Jacholkowska, A.
A1 - Jamrozy, M.
A1 - Janiak, M.
A1 - Jean, P.
A1 - Jeanney, C.
A1 - Jimenez, J. J.
A1 - Jogler, T.
A1 - Johnson, T.
A1 - Journet, L.
A1 - Juffroy, C.
A1 - Jung, I.
A1 - Kaaret, P.
A1 - Kabuki, S.
A1 - Kagaya, M.
A1 - Kakuwa, J.
A1 - Kalkuhl, C.
A1 - Kankanyan, R.
A1 - Karastergiou, A.
A1 - Kaercher, K.
A1 - Karczewski, M.
A1 - Karkar, S.
A1 - Kasperek, Aci.
A1 - Kastana, D.
A1 - Katagiri, H.
A1 - Kataoka, J.
A1 - Katarzynski, K.
A1 - Katz, U.
A1 - Kawanaka, N.
A1 - Kellner-Leidel, B.
A1 - Kelly, H.
A1 - Kendziorra, E.
A1 - Khelifi, B.
A1 - Kieda, D. B.
A1 - Kifune, T.
A1 - Kihm, T.
A1 - Kishimoto, T.
A1 - Kitamoto, K.
A1 - Kluzniak, W.
A1 - Knapic, C.
A1 - Knapp, J. w
A1 - Knoedlseder, J.
A1 - Koeck, F.
A1 - Kocot, J.
A1 - Kodani, K.
A1 - Koehne, J. -H.
A1 - Kohri, K.
A1 - Kokkotas, K.
A1 - Kolitzus, D.
A1 - Komin, N.
A1 - Kominis, I.
A1 - Konno, Y.
A1 - Koeppel, H.
A1 - Korohoda, P.
A1 - Kosack, K.
A1 - Koss, G.
A1 - Kossakowski, R.
A1 - Kostka, P.
A1 - Koul, R.
A1 - Kowal, G.
A1 - Koyama, S.
A1 - Koziol, J.
A1 - Kraehenbuehl, T.
A1 - Krause, J.
A1 - Krawzcynski, H.
A1 - Krennrich, F.
A1 - Krepps, A.
A1 - Kretzschmann, A.
A1 - Krobot, R.
A1 - Krueger, P.
A1 - Kubo, H.
A1 - Kudryavtsev, V. A.
A1 - Kushida, J.
A1 - Kuznetsov, A.
A1 - La Barbera, A.
A1 - La Palombara, N.
A1 - La Parola, V.
A1 - La Rosa, G.
A1 - Lacombe, K.
A1 - Lamanna, G.
A1 - Lande, J.
A1 - Languignon, D.
A1 - Lapington, J.
A1 - Laporte, P.
A1 - Lavalley, C.
A1 - Le Flour, T.
A1 - Le Padellec, A.
A1 - Lee, S. -H.
A1 - Lee, W. H.
A1 - Leigui de Oliveira, M. A.
A1 - Lelas, D.
A1 - Lenain, J. -P.
A1 - Leopold, D. J.
A1 - Lerch, T.
A1 - Lessio, L.
A1 - Lieunard, B.
A1 - Lindfors, E.
A1 - Liolios, A.
A1 - Lipniacka, A.
A1 - Lockart, H.
A1 - Lohse, T.
A1 - Lombardi, S.
A1 - Lopatin, A.
A1 - Lopez, M.
A1 - Lopez-Coto, R.
A1 - Lopez-Oramas, A.
A1 - Lorca, A.
A1 - Lorenz, E.
A1 - Lubinski, P.
A1 - Lucarelli, F.
A1 - Luedecke, H.
A1 - Ludwin, J.
A1 - Luque-Escamilla, P. L.
A1 - Lustermann, W.
A1 - Luz, O.
A1 - Lyard, E.
A1 - Maccarone, M. C.
A1 - Maccarone, T. J.
A1 - Madejski, G. M.
A1 - Madhavan, A.
A1 - Mahabir, M.
A1 - Maier, G.
A1 - Majumdar, P.
A1 - Malaguti, G.
A1 - Maltezos, S.
A1 - Manalaysay, A.
A1 - Mancilla, A.
A1 - Mandat, D.
A1 - Maneva, G.
A1 - Mangano, A.
A1 - Manigot, P.
A1 - Mannheim, K.
A1 - Manthos, I.
A1 - Maragos, N.
A1 - Marcowith, Alexandre
A1 - Mariotti, M.
A1 - Marisaldi, M.
A1 - Markoff, S.
A1 - Marszalek, A.
A1 - Martens, C.
A1 - Marti, J.
A1 - Martin, J-M.
A1 - Martin, P.
A1 - Martinez, G.
A1 - Martinez, F.
A1 - Martinez, M.
A1 - Masserot, A.
A1 - Mastichiadis, A.
A1 - Mathieu, A.
A1 - Matsumoto, H.
A1 - Mattana, F.
A1 - Mattiazzo, S.
A1 - Maurin, G.
A1 - Maxfield, S.
A1 - Maya, J.
A1 - Mazin, D.
A1 - Mc Comb, L.
A1 - McCubbin, N.
A1 - McHardy, I.
A1 - McKay, R.
A1 - Medina, C.
A1 - Melioli, C.
A1 - Melkumyan, D.
A1 - Mereghetti, S.
A1 - Mertsch, P.
A1 - Meucci, M.
A1 - Michalowski, J.
A1 - Micolon, P.
A1 - Mihailidis, A.
A1 - Mineo, T.
A1 - Minuti, M.
A1 - Mirabal, N.
A1 - Mirabel, F.
A1 - Miranda, J. M.
A1 - Mirzoyan, R.
A1 - Mizuno, T.
A1 - Moal, B.
A1 - Moderski, R.
A1 - Mognet, I.
A1 - Molinari, E.
A1 - Molinaro, M.
A1 - Montaruli, T.
A1 - Monteiro, I.
A1 - Moore, P.
A1 - Moralejo Olaizola, A.
A1 - Mordalska, M.
A1 - Morello, C.
A1 - Mori, K.
A1 - Mottez, F.
A1 - Moudden, Y.
A1 - Moulin, Emmanuel
A1 - Mrusek, I.
A1 - Mukherjee, R.
A1 - Munar-Adrover, P.
A1 - Muraishi, H.
A1 - Murase, K.
A1 - Murphy, A.
A1 - Nagataki, S.
A1 - Naito, T.
A1 - Nakajima, D.
A1 - Nakamori, T.
A1 - Nakayama, K.
A1 - Naumann, C. L.
A1 - Naumann, D.
A1 - Naumann-Godo, M.
A1 - Nayman, P.
A1 - Nedbal, D.
A1 - Neise, D.
A1 - Nellen, L.
A1 - Neustroev, V.
A1 - Neyroud, N.
A1 - Nicastro, L.
A1 - Nicolau-Kuklinski, J.
A1 - Niedzwiecki, A.
A1 - Niemiec, J.
A1 - Nieto, D.
A1 - Nikolaidis, A.
A1 - Nishijima, K.
A1 - Nolan, S.
A1 - Northrop, R.
A1 - Nosek, D.
A1 - Nowak, N.
A1 - Nozato, A.
A1 - O'Brien, P.
A1 - Ohira, Y.
A1 - Ohishi, M.
A1 - Ohm, S.
A1 - Ohoka, H.
A1 - Okuda, T.
A1 - Okumura, A.
A1 - Olive, J. -F.
A1 - Ong, R. A.
A1 - Orito, R.
A1 - Orr, M.
A1 - Osborne, J.
A1 - Ostrowski, M.
A1 - Otero, L. A.
A1 - Otte, N.
A1 - Ovcharov, E.
A1 - Oya, I.
A1 - Ozieblo, A.
A1 - Padilla, L.
A1 - Paiano, S.
A1 - Paillot, D.
A1 - Paizis, A.
A1 - Palanque, S.
A1 - Palatka, M.
A1 - Pallota, J.
A1 - Panagiotidis, K.
A1 - Panazol, J. -L.
A1 - Paneque, D.
A1 - Panter, M.
A1 - Paoletti, R.
A1 - Papayannis, Alexandros
A1 - Papyan, G.
A1 - Paredes, J. M.
A1 - Pareschi, G.
A1 - Parks, G.
A1 - Parraud, J. -M.
A1 - Parsons, D.
A1 - Arribas, M. Paz
A1 - Pech, M.
A1 - Pedaletti, G.
A1 - Pelassa, V.
A1 - Pelat, D.
A1 - Perez, M. D. C.
A1 - Persic, M.
A1 - Petrucci, P-O
A1 - Peyaud, B.
A1 - Pichel, A.
A1 - Pita, S.
A1 - Pizzolato, F.
A1 - Platos, L.
A1 - Platzer, R.
A1 - Pogosyan, L.
A1 - Pohl, M.
A1 - Pojmanski, G.
A1 - Ponz, J. D.
A1 - Potter, W.
A1 - Poutanen, J.
A1 - Prandini, E.
A1 - Prast, J.
A1 - Preece, R.
A1 - Profeti, F.
A1 - Prokoph, H.
A1 - Prouza, M.
A1 - Proyetti, M.
A1 - Puerto-Gimenez, I.
A1 - Puehlhofer, G.
A1 - Puljak, I.
A1 - Punch, M.
A1 - Pyziol, R.
A1 - Quel, E. J.
A1 - Quinn, J.
A1 - Quirrenbach, A.
A1 - Racero, E.
A1 - Rajda, P. J.
A1 - Ramon, P.
A1 - Rando, R.
A1 - Rannot, R. C.
A1 - Rataj, M.
A1 - Raue, M.
A1 - Reardon, P.
A1 - Reimann, O.
A1 - Reimer, A.
A1 - Reimer, O.
A1 - Reitberger, K.
A1 - Renaud, M.
A1 - Renner, S.
A1 - Reville, B.
A1 - Rhode, W.
A1 - Ribo, M.
A1 - Ribordy, M.
A1 - Richer, M. G.
A1 - Rico, J.
A1 - Ridky, J.
A1 - Rieger, F.
A1 - Ringegni, P.
A1 - Ripken, J.
A1 - Ristori, P. R.
A1 - Riviere, A.
A1 - Rivoire, S.
A1 - Rob, L.
A1 - Roeser, U.
A1 - Rohlfs, R.
A1 - Rojas, G.
A1 - Romano, Patrizia
A1 - Romaszkan, W.
A1 - Romero, G. E.
A1 - Rosen, S.
A1 - Lees, S. Rosier
A1 - Ross, D.
A1 - Rouaix, G.
A1 - Rousselle, J.
A1 - Rousselle, S.
A1 - Rovero, A. C.
A1 - Roy, F.
A1 - Royer, S.
A1 - Rudak, B.
A1 - Rulten, C.
A1 - Rupinski, M.
A1 - Russo, F.
A1 - Ryde, F.
A1 - Sacco, B.
A1 - Saemann, E. O.
A1 - Saggion, A.
A1 - Safiakian, V.
A1 - Saito, K.
A1 - Saito, T.
A1 - Saito, Y.
A1 - Sakaki, N.
A1 - Sakonaka, R.
A1 - Salini, A.
A1 - Sanchez, F.
A1 - Sanchez-Conde, M.
A1 - Sandoval, A.
A1 - Sandaker, H.
A1 - Sant'Ambrogio, E.
A1 - Santangelo, Andrea
A1 - Santos, E. M.
A1 - Sanuy, A.
A1 - Sapozhnikov, L.
A1 - Sarkar, S.
A1 - Sartore, N.
A1 - Sasaki, H.
A1 - Satalecka, K.
A1 - Sawada, M.
A1 - Scalzotto, V.
A1 - Scapin, V.
A1 - Scarcioffolo, M.
A1 - Schafer, J.
A1 - Schanz, T.
A1 - Schlenstedt, S.
A1 - Schlickeiser, R.
A1 - Schmidt, T.
A1 - Schmoll, J.
A1 - Schovanek, P.
A1 - Schroedter, M.
A1 - Schultz, C.
A1 - Schultze, J.
A1 - Schulz, A.
A1 - Schure, K.
A1 - Schwab, T.
A1 - Schwanke, U.
A1 - Schwarz, J.
A1 - Schwarzburg, S.
A1 - Schweizer, T.
A1 - Schwemmer, S.
A1 - Segreto, A.
A1 - Seiradakis, J. -H.
A1 - Sembroski, G. H.
A1 - Seweryn, K.
A1 - Sharma, M.
A1 - Shayduk, M.
A1 - Shellard, R. C.
A1 - Shi, J.
A1 - Shibata, T.
A1 - Shibuya, A.
A1 - Shum, E.
A1 - Sidoli, L.
A1 - Sidz, M.
A1 - Sieiro, J.
A1 - Sikora, M.
A1 - Silk, J.
A1 - Sillanpaa, A.
A1 - Singh, B. B.
A1 - Sitarek, J.
A1 - Skole, C.
A1 - Smareglia, R.
A1 - Smith, A.
A1 - Smith, D.
A1 - Smith, J.
A1 - Smith, N.
A1 - Sobczynska, D.
A1 - Sol, H.
A1 - Sottile, G.
A1 - Sowinski, M.
A1 - Spanier, F.
A1 - Spiga, D.
A1 - Spyrou, S.
A1 - Stamatescu, V.
A1 - Stamerra, A.
A1 - Starling, R.
A1 - Stawarz, L.
A1 - Steenkamp, R.
A1 - Stegmann, Christian
A1 - Steiner, S.
A1 - Stergioulas, N.
A1 - Sternberger, R.
A1 - Sterzel, M.
A1 - Stinzing, F.
A1 - Stodulski, M.
A1 - Straumann, U.
A1 - Strazzeri, E.
A1 - Stringhetti, L.
A1 - Suarez, A.
A1 - Suchenek, M.
A1 - Sugawara, R.
A1 - Sulanke, K. -H.
A1 - Sun, S.
A1 - Supanitsky, A. D.
A1 - Suric, T.
A1 - Sutcliffe, P.
A1 - Sykes, J.
A1 - Szanecki, M.
A1 - Szepieniec, T.
A1 - Szostek, A.
A1 - Tagliaferri, G.
A1 - Tajima, H.
A1 - Takahashi, H.
A1 - Takahashi, K.
A1 - Takalo, L.
A1 - Takami, H.
A1 - Talbot, C.
A1 - Tammi, J.
A1 - Tanaka, M.
A1 - Tanaka, S.
A1 - Tasan, J.
A1 - Tavani, M.
A1 - Tavernet, J. -P.
A1 - Tejedor, L. A.
A1 - Telezhinsky, Igor O.
A1 - Temnikov, P.
A1 - Tenzer, C.
A1 - Terada, Y.
A1 - Terrier, R.
A1 - Teshima, M.
A1 - Testa, V.
A1 - Tezier, D.
A1 - Thuermann, D.
A1 - Tibaldo, L.
A1 - Tibolla, O.
A1 - Tiengo, A.
A1 - Tluczykont, M.
A1 - Todero Peixoto, C. J.
A1 - Tokanai, F.
A1 - Tokarz, M.
A1 - Toma, K.
A1 - Torii, K.
A1 - Tornikoski, M.
A1 - Torres, D. F.
A1 - Torres, M.
A1 - Tosti, G.
A1 - Totani, T.
A1 - Toussenel, C.
A1 - Tovmassian, G.
A1 - Travnicek, P.
A1 - Trifoglio, M.
A1 - Troyano, I.
A1 - Tsinganos, K.
A1 - Ueno, H.
A1 - Umehara, K.
A1 - Upadhya, S. S.
A1 - Usher, T.
A1 - Uslenghi, M.
A1 - Valdes-Galicia, J. F.
A1 - Vallania, P.
A1 - Vallejo, G.
A1 - van Driel, W.
A1 - van Eldik, C.
A1 - Vandenbrouke, J.
A1 - Vanderwalt, J.
A1 - Vankov, H.
A1 - Vasileiadis, G.
A1 - Vassiliev, V.
A1 - Veberic, D.
A1 - Vegas, I.
A1 - Vercellone, S.
A1 - Vergani, S.
A1 - Veyssiere, C.
A1 - Vialle, J. P.
A1 - Viana, A.
A1 - Videla, M.
A1 - Vincent, P.
A1 - Vincent, S.
A1 - Vink, J.
A1 - Vlahakis, N.
A1 - Vlahos, L.
A1 - Vogler, P.
A1 - Vollhardt, A.
A1 - von Gunten, H. P.
A1 - Vorobiov, S.
A1 - Vuerli, C.
A1 - Waegebaert, V.
A1 - Wagner, R.
A1 - Wagner, R. G.
A1 - Wagner, S.
A1 - Wakely, S. P.
A1 - Walter, R.
A1 - Walther, T.
A1 - Warda, K.
A1 - Warwick, R.
A1 - Wawer, P.
A1 - Wawrzaszek, R.
A1 - Webb, N.
A1 - Wegner, P.
A1 - Weinstein, A.
A1 - Weitzel, Q.
A1 - Welsing, R.
A1 - Werner, M.
A1 - Wetteskind, H.
A1 - White, R.
A1 - Wierzcholska, A.
A1 - Wiesand, S.
A1 - Wilkinson, M.
A1 - Williams, D. A.
A1 - Willingale, R.
A1 - Winiarski, K.
A1 - Wischnewski, R.
A1 - Wisniewski, L.
A1 - Wood, M.
A1 - Woernlein, A.
A1 - Xiong, Q.
A1 - Yadav, K. K.
A1 - Yamamoto, H.
A1 - Yamamoto, T.
A1 - Yamazaki, R.
A1 - Yanagita, S.
A1 - Yebras, J. M.
A1 - Yelos, D.
A1 - Yoshida, A.
A1 - Yoshida, T.
A1 - Yoshikoshi, T.
A1 - Zabalza, V.
A1 - Zacharias, M.
A1 - Zajczyk, A.
A1 - Zanin, R.
A1 - Zdziarski, A.
A1 - Zech, Alraune
A1 - Zhao, A.
A1 - Zhou, X.
A1 - Zietara, K.
A1 - Ziolkowski, J.
A1 - Ziolkowski, P.
A1 - Zitelli, V.
A1 - Zurbach, C.
A1 - Zychowski, P.
T1 - Introducing the CTA concept
T2 - Astroparticle physics
N2 - The Cherenkov Telescope Array (CTA) is a new observatory for very high-energy (VHE) gamma rays. CTA has ambitions science goals, for which it is necessary to achieve full-sky coverage, to improve the sensitivity by about an order of magnitude, to span about four decades of energy, from a few tens of GeV to above 100 TeV with enhanced angular and energy resolutions over existing VHE gamma-ray observatories. An international collaboration has formed with more than 1000 members from 27 countries in Europe, Asia, Africa and North and South America. In 2010 the CTA Consortium completed a Design Study and started a three-year Preparatory Phase which leads to production readiness of CTA in 2014. In this paper we introduce the science goals and the concept of CTA, and provide an overview of the project.
KW - TeV gamma-ray astronomy
KW - Air showers
KW - Cherenkov Telescopes
Y1 - 2013
U6 - https://doi.org/10.1016/j.astropartphys.2013.01.007
SN - 0927-6505
SN - 1873-2852
VL - 43
IS - 2
SP - 3
EP - 18
PB - Elsevier
CY - Amsterdam
ER -
TY - JOUR
A1 - Loster, Michael
A1 - Koumarelas, Ioannis
A1 - Naumann, Felix
T1 - Knowledge transfer for entity resolution with siamese neural networks
JF - ACM journal of data and information quality
N2 - The integration of multiple data sources is a common problem in a large variety of applications. Traditionally, handcrafted similarity measures are used to discover, merge, and integrate multiple representations of the same entity-duplicates-into a large homogeneous collection of data. Often, these similarity measures do not cope well with the heterogeneity of the underlying dataset. In addition, domain experts are needed to manually design and configure such measures, which is both time-consuming and requires extensive domain expertise.
We propose a deep Siamese neural network, capable of learning a similarity measure that is tailored to the characteristics of a particular dataset. With the properties of deep learning methods, we are able to eliminate the manual feature engineering process and thus considerably reduce the effort required for model construction. In addition, we show that it is possible to transfer knowledge acquired during the deduplication of one dataset to another, and thus significantly reduce the amount of data required to train a similarity measure. We evaluated our method on multiple datasets and compare our approach to state-of-the-art deduplication methods. Our approach outperforms competitors by up to +26 percent F-measure, depending on task and dataset. In addition, we show that knowledge transfer is not only feasible, but in our experiments led to an improvement in F-measure of up to +4.7 percent.
KW - Entity resolution
KW - duplicate detection
KW - transfer learning
KW - neural
KW - networks
KW - metric learning
KW - similarity learning
KW - data quality
Y1 - 2021
U6 - https://doi.org/10.1145/3410157
SN - 1936-1955
SN - 1936-1963
VL - 13
IS - 1
PB - Association for Computing Machinery
CY - New York
ER -
TY - JOUR
A1 - Aliu, E.
A1 - Archambault, S.
A1 - Aune, T.
A1 - Behera, B.
A1 - Beilicke, M.
A1 - Benbow, W.
A1 - Berger, K.
A1 - Bird, R.
A1 - Bouvier, A.
A1 - Buckley, J. H.
A1 - Bugaev, V.
A1 - Byrum, K.
A1 - Cerruti, M.
A1 - Chen, X.
A1 - Ciupik, L.
A1 - Connolly, M. P.
A1 - Cui, W.
A1 - Duke, C.
A1 - Dumm, J.
A1 - Errando, M.
A1 - Falcone, A.
A1 - Federici, S.
A1 - Feng, Q.
A1 - Finley, J. P.
A1 - Fortin, P.
A1 - Fortson, L.
A1 - Furniss, A.
A1 - Galante, N.
A1 - Gillanders, G. H.
A1 - Griffin, S.
A1 - Griffiths, S. T.
A1 - Grube, J.
A1 - Gyuk, G.
A1 - Hanna, D.
A1 - Holder, J.
A1 - Hughes, G.
A1 - Humensky, T. B.
A1 - Kaaret, P.
A1 - Kertzman, M.
A1 - Khassen, Y.
A1 - Kieda, D.
A1 - Krawczynski, H.
A1 - Krennrich, F.
A1 - Lang, M. J.
A1 - Madhavan, A. S.
A1 - Maier, G.
A1 - Majumdar, P.
A1 - McCann, A.
A1 - Moriarty, P.
A1 - Mukherjee, R.
A1 - Nieto, D.
A1 - Ong, R. A.
A1 - Otte, A. N.
A1 - Park, N.
A1 - Perkins, J. S.
A1 - Pohl, M.
A1 - Popkow, A.
A1 - Prokoph, H.
A1 - Quinn, J.
A1 - Ragan, K.
A1 - Rajotte, J.
A1 - Reyes, L. C.
A1 - Reynolds, P. T.
A1 - Richards, G. T.
A1 - Roache, E.
A1 - Rousselle, J.
A1 - Sembroski, G. H.
A1 - Sheidaei, F.
A1 - Skole, C.
A1 - Smith, A. W.
A1 - Staszak, D.
A1 - Stroh, M.
A1 - Telezhinsky, Igor O.
A1 - Theiling, M.
A1 - Tucci, J. V.
A1 - Tyler, J.
A1 - Varlotta, A.
A1 - Vincent, S.
A1 - Wakely, S. P.
A1 - Weinstein, A.
A1 - Welsing, R.
A1 - Williams, D. A.
A1 - Zajczyk, A.
A1 - Zitzer, B.
A1 - Abramowski, Attila
A1 - Aharonian, Felix A.
A1 - Benkhali, Faical Ait
A1 - Akhperjanian, A. G.
A1 - Angüner, Ekrem Oǧuzhan
A1 - Anton, Gisela
A1 - Balenderan, Shangkari
A1 - Balzer, Arnim
A1 - Barnacka, Anna
A1 - Becherini, Yvonne
A1 - Tjus, J. Becker
A1 - Bernlöhr, K.
A1 - Birsin, E.
A1 - Bissaldi, E.
A1 - Biteau, Jonathan
A1 - Boettcher, Markus
A1 - Boisson, Catherine
A1 - Bolmont, J.
A1 - Bordas, Pol
A1 - Brucker, J.
A1 - Brun, Francois
A1 - Brun, Pierre
A1 - Bulik, Tomasz
A1 - Carrigan, Svenja
A1 - Casanova, Sabrina
A1 - Cerruti, M.
A1 - Chadwick, Paula M.
A1 - Chalme-Calvet, R.
A1 - Chaves, Ryan C. G.
A1 - Cheesebrough, A.
A1 - Chretien, M.
A1 - Colafrancesco, Sergio
A1 - Cologna, Gabriele
A1 - Conrad, Jan
A1 - Couturier, C.
A1 - Dalton, M.
A1 - Daniel, M. K.
A1 - Davids, I. D.
A1 - Degrange, B.
A1 - Deil, C.
A1 - deWilt, P.
A1 - Dickinson, H. J.
A1 - Djannati-Ataï, A.
A1 - Domainko, W.
A1 - Dubus, G.
A1 - Dutson, K.
A1 - Dyks, J.
A1 - Dyrda, M.
A1 - Edwards, T.
A1 - Egberts, Kathrin
A1 - Eger, P.
A1 - Espigat, P.
A1 - Farnier, C.
A1 - Fegan, S.
A1 - Feinstein, F.
A1 - Fernandes, M. V.
A1 - Fernandez, D.
A1 - Fiasson, A.
A1 - Fontaine, G.
A1 - Foerster, A.
A1 - Fuessling, M.
A1 - Gajdus, M.
A1 - Gallant, Y. A.
A1 - Garrigoux, T.
A1 - Giavitto, G.
A1 - Giebels, B.
A1 - Glicenstein, J. F.
A1 - Grondin, M. -H.
A1 - Grudzinska, M.
A1 - Haeffner, S.
A1 - Hahn, J.
A1 - Harris, J.
A1 - Heinzelmann, G.
A1 - Henri, G.
A1 - Hermann, G.
A1 - Hervet, O.
A1 - Hillert, A.
A1 - Hinton, James Anthony
A1 - Hofmann, W.
A1 - Hofverberg, P.
A1 - Holler, M.
A1 - Horns, D.
A1 - Jacholkowska, A.
A1 - Jahn, C.
A1 - Jamrozy, M.
A1 - Janiak, M.
A1 - Jankowsky, F.
A1 - Jung, I.
A1 - Kastendieck, M. A.
A1 - Katarzynski, K.
A1 - Katz, U.
A1 - Kaufmann, S.
A1 - Khelifi, B.
A1 - Kieffer, M.
A1 - Klepser, S.
A1 - Klochkov, D.
A1 - Kluzniak, W.
A1 - Kneiske, T.
A1 - Kolitzus, D.
A1 - Komin, Nu.
A1 - Kosack, K.
A1 - Krakau, S.
A1 - Krayzel, F.
A1 - Krueger, P. P.
A1 - Laffon, H.
A1 - Lamanna, G.
A1 - Lefaucheur, J.
A1 - Lemiere, A.
A1 - Lemoine-Goumard, M.
A1 - Lenain, J. -P.
A1 - Lennarz, D.
A1 - Lohse, T.
A1 - Lopatin, A.
A1 - Lu, C. -C.
A1 - Marandon, V.
A1 - Marcowith, Alexandre
A1 - Marx, R.
A1 - Maurin, G.
A1 - Maxted, N.
A1 - Mayer, M.
A1 - McComb, T. J. L.
A1 - Mehault, J.
A1 - Menzler, U.
A1 - Meyer, M.
A1 - Moderski, R.
A1 - Mohamed, M.
A1 - Moulin, Emmanuel
A1 - Murach, T.
A1 - Naumann, C. L.
A1 - de Naurois, M.
A1 - Niemiec, J.
A1 - Nolan, S. J.
A1 - Oakes, L.
A1 - Ohm, S.
A1 - Wilhelmi, E. de Ona
A1 - Opitz, B.
A1 - Ostrowski, M.
A1 - Oya, I.
A1 - Panter, M.
A1 - Parsons, R. D.
A1 - Arribas, M. Paz
A1 - Pekeur, N. W.
A1 - Pelletier, G.
A1 - Perez, J.
A1 - Petrucci, P. -O.
A1 - Peyaud, B.
A1 - Pita, S.
A1 - Poon, H.
A1 - Puehlhofer, G.
A1 - Punch, M.
A1 - Quirrenbach, A.
A1 - Raab, S.
A1 - Raue, M.
A1 - Reimer, A.
A1 - Reimer, O.
A1 - Renaud, M.
A1 - de los Reyes, R.
A1 - Rieger, F.
A1 - Rob, L.
A1 - Romoli, C.
A1 - Rosier-Lees, S.
A1 - Rowell, G.
A1 - Rudak, B.
A1 - Rulten, C. B.
A1 - Sahakian, V.
A1 - Sanchez, David M.
A1 - Santangelo, Andrea
A1 - Schlickeiser, R.
A1 - Schuessler, F.
A1 - Schulz, A.
A1 - Schwanke, U.
A1 - Schwarzburg, S.
A1 - Schwemmer, S.
A1 - Sol, H.
A1 - Spengler, G.
A1 - Spies, F.
A1 - Stawarz, L.
A1 - Steenkamp, R.
A1 - Stegmann, Christian
A1 - Stinzing, F.
A1 - Stycz, K.
A1 - Sushch, Iurii
A1 - Szostek, A.
A1 - Tavernet, J. -P.
A1 - Tavernier, T.
A1 - Taylor, A. M.
A1 - Terrier, R.
A1 - Tluczykont, M.
A1 - Trichard, C.
A1 - Valerius, K.
A1 - van Eldik, C.
A1 - Vasileiadis, G.
A1 - Venter, C.
A1 - Viana, A.
A1 - Vincent, P.
A1 - Voelk, H. J.
A1 - Volpe, F.
A1 - Vorster, M.
A1 - Wagner, S. J.
A1 - Wagner, P.
A1 - Ward, M.
A1 - Weidinger, M.
A1 - Weitzel, Q.
A1 - White, R.
A1 - Wierzcholska, A.
A1 - Willmann, P.
A1 - Woernlein, A.
A1 - Wouters, D.
A1 - Zacharias, M.
A1 - Zajczyk, A.
A1 - Zdziarski, A. A.
A1 - Zech, Alraune
A1 - Zechlin, H. -S.
T1 - Long-term TeV and X-RAY observations of the GAMMA- RAY binary hess J0632+057
JF - The astrophysical journal : an international review of spectroscopy and astronomical physics
KW - acceleration of particles
KW - binaries: general
KW - gamma rays: general(HESS J0632+057, VER J0633+057)
Y1 - 2014
U6 - https://doi.org/10.1088/0004-637X/780/2/168
SN - 0004-637X
SN - 1538-4357
VL - 780
IS - 2
PB - IOP Publ. Ltd.
CY - Bristol
ER -
TY - JOUR
A1 - Koumarelas, Ioannis
A1 - Papenbrock, Thorsten
A1 - Naumann, Felix
T1 - MDedup
BT - duplicate detection with matching dependencies
JF - Proceedings of the VLDB Endowment
N2 - Duplicate detection is an integral part of data cleaning and serves to identify multiple representations of same real-world entities in (relational) datasets. Existing duplicate detection approaches are effective, but they are also hard to parameterize or require a lot of pre-labeled training data. Both parameterization and pre-labeling are at least domain-specific if not dataset-specific, which is a problem if a new dataset needs to be cleaned.
For this reason, we propose a novel, rule-based and fully automatic duplicate detection approach that is based on matching dependencies (MDs). Our system uses automatically discovered MDs, various dataset features, and known gold standards to train a model that selects MDs as duplicate detection rules. Once trained, the model can select useful MDs for duplicate detection on any new dataset. To increase the generally low recall of MD-based data cleaning approaches, we propose an additional boosting step. Our experiments show that this approach reaches up to 94% F-measure and 100% precision on our evaluation datasets, which are good numbers considering that the system does not require domain or target data-specific configuration.
Y1 - 2020
U6 - https://doi.org/10.14778/3377369.3377379
SN - 2150-8097
VL - 13
IS - 5
SP - 712
EP - 725
PB - Association for Computing Machinery
CY - New York
ER -
TY - GEN
A1 - Kruse, Sebastian
A1 - Kaoudi, Zoi
A1 - Quiane-Ruiz, Jorge-Arnulfo
A1 - Chawla, Sanjay
A1 - Naumann, Felix
A1 - Contreras-Rojas, Bertty
T1 - Optimizing Cross-Platform Data Movement
T2 - 2019 IEEE 35th International Conference on Data Engineering (ICDE)
N2 - Data analytics are moving beyond the limits of a single data processing platform. A cross-platform query optimizer is necessary to enable applications to run their tasks over multiple platforms efficiently and in a platform-agnostic manner. For the optimizer to be effective, it must consider data movement costs across different data processing platforms. In this paper, we present the graph-based data movement strategy used by RHEEM, our open-source cross-platform system. In particular, we (i) model the data movement problem as a new graph problem, which we prove to be NP-hard, and (ii) propose a novel graph exploration algorithm, which allows RHEEM to discover multiple hidden opportunities for cross-platform data processing.
Y1 - 2019
SN - 978-1-5386-7474-1
SN - 978-1-5386-7475-8
U6 - https://doi.org/10.1109/ICDE.2019.00162
SN - 1084-4627
SN - 1063-6382
SP - 1642
EP - 1645
PB - IEEE
CY - New York
ER -
TY - JOUR
A1 - Vitagliano, Gerardo
A1 - Hameed, Mazhar
A1 - Jiang, Lan
A1 - Reisener, Lucas
A1 - Wu, Eugene
A1 - Naumann, Felix
T1 - Pollock: a data loading benchmark
JF - Proceedings of the VLDB Endowment
N2 - Any system at play in a data-driven project has a fundamental requirement: the ability to load data. The de-facto standard format to distribute and consume raw data is CSV. Yet, the plain text and flexible nature of this format make such files often difficult to parse and correctly load their content, requiring cumbersome data preparation steps. We propose a benchmark to assess the robustness of systems in loading data from non-standard CSV formats and with structural inconsistencies. First, we formalize a model to describe the issues that affect real-world files and use it to derive a systematic lpollutionz process to generate dialects for any given grammar. Our benchmark leverages the pollution framework for the csv format. To guide pollution, we have surveyed thousands of real-world, publicly available csv files, recording the problems we encountered. We demonstrate the applicability of our benchmark by testing and scoring 16 different systems: popular csv parsing frameworks, relational database tools, spreadsheet systems, and a data visualization tool.
Y1 - 2023
U6 - https://doi.org/10.14778/3594512.3594518
SN - 2150-8097
VL - 16
IS - 8
SP - 1870
EP - 1882
PB - Association for Computing Machinery
CY - New York
ER -
TY - JOUR
A1 - Abramowski, Attila
A1 - Aharonian, Felix A.
A1 - Benkhali, Faical Ait
A1 - Akhperjanian, A. G.
A1 - Angüner, Ekrem Oǧuzhan
A1 - Anton, Gisela
A1 - Backes, Michael
A1 - Balenderan, Shangkari
A1 - Balzer, Arnim
A1 - Barnacka, Anna
A1 - Becherini, Yvonne
A1 - Tjus, J. Becker
A1 - Bernlöhr, K.
A1 - Birsin, E.
A1 - Bissaldi, E.
A1 - Biteau, Jonathan
A1 - Boettcher, Markus
A1 - Boisson, Catherine
A1 - Bolmont, J.
A1 - Bordas, Pol
A1 - Brucker, J.
A1 - Brun, Francois
A1 - Brun, Pierre
A1 - Bulik, Tomasz
A1 - Carrigan, Svenja
A1 - Casanova, Sabrina
A1 - Chadwick, Paula M.
A1 - Chalme-Calvet, R.
A1 - Chaves, Ryan C. G.
A1 - Cheesebrough, A.
A1 - Chretien, M.
A1 - Colafrancesco, Sergio
A1 - Cologna, Gabriele
A1 - Conrad, Jan
A1 - Couturier, C.
A1 - Cui, Y.
A1 - Dalton, M.
A1 - Daniel, M. K.
A1 - Davids, I. D.
A1 - Degrange, B.
A1 - Deil, C.
A1 - deWilt, P.
A1 - Dickinson, H. J.
A1 - Djannati-Ataï, A.
A1 - Domainko, W.
A1 - Dubus, G.
A1 - Dutson, K.
A1 - Dyks, J.
A1 - Dyrda, M.
A1 - Edwards, T.
A1 - Egberts, Kathrin
A1 - Eger, P.
A1 - Espigat, P.
A1 - Farnier, C.
A1 - Fegan, S.
A1 - Feinstein, F.
A1 - Fernandes, M. V.
A1 - Fernandez, D.
A1 - Fiasson, A.
A1 - Fontaine, G.
A1 - Foerster, A.
A1 - Füßling, Matthias
A1 - Gajdus, M.
A1 - Gallant, Y. A.
A1 - Garrigoux, T.
A1 - Giavitto, G.
A1 - Giebels, B.
A1 - Glicenstein, J. F.
A1 - Grondin, M. -H.
A1 - Grudzinska, M.
A1 - Haeffner, S.
A1 - Hahn, J.
A1 - Harris, J.
A1 - Heinzelmann, G.
A1 - Henri, G.
A1 - Hermann, G.
A1 - Hervet, O.
A1 - Hillert, A.
A1 - Hinton, James Anthony
A1 - Hofmann, W.
A1 - Hofverberg, P.
A1 - Holler, Markus
A1 - Horns, D.
A1 - Jacholkowska, A.
A1 - Jahn, C.
A1 - Jamrozy, M.
A1 - Janiak, M.
A1 - Jankowsky, F.
A1 - Jung, I.
A1 - Kastendieck, M. A.
A1 - Katarzynski, K.
A1 - Katz, U.
A1 - Kaufmann, S.
A1 - Khelifi, B.
A1 - Kieffer, M.
A1 - Klepser, S.
A1 - Klochkov, D.
A1 - Kluzniak, W.
A1 - Kneiske, T.
A1 - Kolitzus, D.
A1 - Komin, Nu.
A1 - Kosack, K.
A1 - Krakau, S.
A1 - Krayzel, F.
A1 - Krueger, P. P.
A1 - Laffon, H.
A1 - Lamanna, G.
A1 - Lefaucheur, J.
A1 - Lemiere, A.
A1 - Lemoine-Goumard, M.
A1 - Lenain, J. -P.
A1 - Lohse, T.
A1 - Lopatin, A.
A1 - Lu, C. -C.
A1 - Marandon, V.
A1 - Marcowith, Alexandre
A1 - Marx, R.
A1 - Maurin, G.
A1 - Maxted, N.
A1 - Mayer, Markus
A1 - McComb, T. J. L.
A1 - Mehault, J.
A1 - Meintjes, P. J.
A1 - Menzler, U.
A1 - Meyer, M.
A1 - Moderski, R.
A1 - Mohamed, M.
A1 - Moulin, Emmanuel
A1 - Murach, T.
A1 - Naumann, C. L.
A1 - de Naurois, M.
A1 - Niemiec, J.
A1 - Nolan, S. J.
A1 - Oakes, L.
A1 - Odaka, H.
A1 - Ohm, S.
A1 - Wilhelmi, E. de Ona
A1 - Opitz, B.
A1 - Ostrowski, M.
A1 - Oya, I.
A1 - Panter, M.
A1 - Parsons, R. D.
A1 - Arribas, M. Paz
A1 - Pekeur, N. W.
A1 - Pelletier, G.
A1 - Perez, J.
A1 - Petrucci, P. -O.
A1 - Peyaud, B.
A1 - Pita, S.
A1 - Poon, H.
A1 - Puehlhofer, G.
A1 - Punch, M.
A1 - Quirrenbach, A.
A1 - Raab, S.
A1 - Raue, M.
A1 - Reichardt, I.
A1 - Reimer, A.
A1 - Reimer, O.
A1 - Renaud, M.
A1 - Reyes, R. de los
A1 - Rieger, F.
A1 - Rob, L.
A1 - Romoli, C.
A1 - Rosier-Lees, S.
A1 - Rowell, G.
A1 - Rudak, B.
A1 - Rulten, C. B.
A1 - Sahakian, V.
A1 - Sanchez, David M.
A1 - Santangelo, Andrea
A1 - Schlickeiser, R.
A1 - Schuessler, F.
A1 - Schulz, A.
A1 - Schwanke, U.
A1 - Schwarzburg, S.
A1 - Schwemmer, S.
A1 - Sol, H.
A1 - Spengler, G.
A1 - Spies, F.
A1 - Stawarz, L.
A1 - Steenkamp, R.
A1 - Stegmann, Christian
A1 - Stinzing, F.
A1 - Stycz, K.
A1 - Sushch, Iurii
A1 - Tavernet, J. -P.
A1 - Tavernier, T.
A1 - Taylor, A. M.
A1 - Terrier, R.
A1 - Tluczykont, M.
A1 - Trichard, C.
A1 - Valerius, K.
A1 - van Eldik, C.
A1 - van Soelen, B.
A1 - Vasileiadis, G.
A1 - Venter, C.
A1 - Viana, A.
A1 - Vincent, P.
A1 - Voelk, H. J.
A1 - Volpe, F.
A1 - Vorster, M.
A1 - Vuillaume, T.
A1 - Wagner, S. J.
A1 - Wagner, P.
A1 - Wagner, R. M.
A1 - Ward, M.
A1 - Weidinger, M.
A1 - Weitzel, Q.
A1 - White, R.
A1 - Wierzcholska, A.
A1 - Willmann, P.
A1 - Woernlein, A.
A1 - Wouters, D.
A1 - Yang, R.
A1 - Zabalza, V.
A1 - Zacharias, M.
A1 - Zdziarski, A. A.
A1 - Zech, Alraune
A1 - Zechlin, H. -S.
A1 - Acero, F.
A1 - Casandjian, J. M.
A1 - Cohen-Tanugi, J.
A1 - Giordano, F.
A1 - Guillemot, L.
A1 - Lande, J.
A1 - Pletsch, H.
A1 - Uchiyama, Y.
T1 - Probing the gamma-ray emission from HESS J1834-087 using HESS and Fermi LAT observations
JF - Astronomy and astrophysics : an international weekly journal
N2 - Aims. Previous observations with the High Energy Stereoscopic System (H.E.S.S.) have revealed an extended very-high-energy (VHE; E > 100 GeV) gamma-ray source, HESS J1834-087, coincident with the supernova remnant (SNR) W41. The origin of the gamma-ray emission was investigated in more detail with the H.E.S.S. array and the Large Area Telescope (LAT) onboard the Fermi Gamma-ray Space Telescope.
Methods. The gamma-ray data provided by 61 h of observations with H.E.S.S., and four years with the Fermi LAT were analyzed, covering over five decades in energy from 1.8 GeV up to 30 TeV. The morphology and spectrum of the TeV and GeV sources were studied and multiwavelength data were used to investigate the origin of the gamma-ray emission toward W41.
Results. The TeV source can be modeled with a sum of two components: one point-like and one significantly extended (sigma(TeV) = 0.17 degrees +/- 0.01 degrees), both centered on SNR W41 and exhibiting spectra described by a power law with index Gamma(TeV) similar or equal to 2.6. The GeV source detected with Fermi LAT is extended (sigma(GeV) = 0.15 degrees +/- 0.03 degrees) and morphologically matches the VHE emission. Its spectrum can be described by a power-law model with an index Gamma(GeV) = 2.15 +/- 0.12 and smoothly joins the spectrum of the whole TeV source. A break appears in the gamma-ray spectra around 100 GeV. No pulsations were found in the GeV range.
Conclusions. Two main scenarios are proposed to explain the observed emission: a pulsar wind nebula (PWN) or the interaction of SNR W41 with an associated molecular cloud. X-ray observations suggest the presence of a point-like source (a pulsar candidate) near the center of the remnant and nonthermal X-ray diffuse emission that could arise from the possibly associated PWN. The PWN scenario is supported by the compatible positions of the TeV and GeV sources with the putative pulsar. However, the spectral energy distribution from radio to gamma-rays is reproduced by a one-zone leptonic model only if an excess of low-energy electrons is injected following a Maxwellian distribution by a pulsar with a high spin-down power (> 10(37) erg s(-1)). This additional low-energy component is not needed if we consider that the point-like TeV source is unrelated to the extended GeV and TeV sources. The interacting SNR scenario is supported by the spatial coincidence between the gamma-ray sources, the detection of OH (1720 MHz) maser lines, and the hadronic modeling.
KW - acceleration of particles
KW - ISM: supernova remnants
KW - ISM: clouds
KW - cosmic rays
Y1 - 2015
U6 - https://doi.org/10.1051/0004-6361/201322694
SN - 0004-6361
SN - 1432-0746
VL - 574
PB - EDP Sciences
CY - Les Ulis
ER -