Changeset 624


Ignore:
Timestamp:
Mar 10, 2008, 2:46:59 PM (13 years ago)
Author:
Nicklas Nordborg
Message:

References #102: Intensity calculator for Illumina SNP data

The main parts are working. Need more testing and probably better error handling and/or configuration options.

Location:
plugins/base2/net.sf.basedb.illumina/trunk
Files:
2 added
5 edited

Legend:

Unmodified
Added
Removed
  • plugins/base2/net.sf.basedb.illumina/trunk/INSTALL

    r583 r624  
    5656    change the 'Install' value to 'yes' or 'plugin+configurations' for all of them.
    5757   * Illumina plug-in package installer
     58   * Illumina BGX reporter importer
    5859   * Illumina BGX feature importer
    59    * Illumina BGX reporter importer
    6060   * Illumina Bead Summary importer
     61   * Illumina SNP raw data importer
     62   * Illumina SNP root bioassayset creator
     63   * Illumina SNP reporter importer
    6164 10. Find the 'Illumina plug-in package installer' in the list of plug-ins and click on it.
    6265 11. Click on the 'Run plugin' button.
  • plugins/base2/net.sf.basedb.illumina/trunk/META-INF/base-configurations.xml

    r580 r624  
    386386    </parameter>
    387387  </configuration>
     388  <configuration pluginClassName="net.sf.basedb.illumina.plugins.SnpReporterImporter">
     389    <configname>Reporters from Illumina SNP manifest file</configname>
     390    <description>Import reporter annotations from an Illumina SNP manifest file.</description>
     391    <parameter>
     392      <name>extendedColumnMapping.accession</name>
     393      <label>Accession</label>
     394      <description />
     395      <class />
     396      <value />
     397    </parameter>
     398    <parameter>
     399      <name>minDataColumns</name>
     400      <label>Min data columns</label>
     401      <description>The minimum number of columns for a line to be counted as a data line.</description>
     402      <class />
     403      <value />
     404    </parameter>
     405    <parameter>
     406      <name>dataFooterRegexp</name>
     407      <label>Data footer</label>
     408      <description>A regular expression that matches the first line of non-data after the data lines. For example: __END_OF_DATA__</description>
     409      <class />
     410      <value />
     411    </parameter>
     412    <parameter>
     413      <name>extendedColumnMapping.cytoband</name>
     414      <label>Cytoband</label>
     415      <description>The cytoband from which the reporter is derived</description>
     416      <class />
     417      <value />
     418    </parameter>
     419    <parameter>
     420      <name>extendedColumnMapping.markers</name>
     421      <label>Markers</label>
     422      <description />
     423      <class />
     424      <value />
     425    </parameter>
     426    <parameter>
     427      <name>extendedColumnMapping.source</name>
     428      <label>Source</label>
     429      <description />
     430      <class />
     431      <value />
     432    </parameter>
     433    <parameter>
     434      <name>extendedColumnMapping.omim</name>
     435      <label>OMIM</label>
     436      <description />
     437      <class />
     438      <value />
     439    </parameter>
     440    <parameter>
     441      <name>extendedColumnMapping.searchKey</name>
     442      <label>Search key</label>
     443      <description />
     444      <class />
     445      <value />
     446    </parameter>
     447    <parameter>
     448      <name>extendedColumnMapping.tissue</name>
     449      <label>Tissue</label>
     450      <description>The tissue from which the reporter is derived</description>
     451      <class />
     452      <value />
     453    </parameter>
     454    <parameter>
     455      <name>descriptionColumnMapping</name>
     456      <label>Description</label>
     457      <description>Mapping that picks the reporter's description from the data columns. For example: \Description\</description>
     458      <class />
     459      <value />
     460    </parameter>
     461    <parameter>
     462      <name>ignoreRegexp</name>
     463      <label>Ignore</label>
     464      <description>A regular expression that matches any line that should be ignored. For example, ignore lines starting with #: ^#.*</description>
     465      <class />
     466      <value />
     467    </parameter>
     468    <parameter>
     469      <name>extendedColumnMapping.clusterId</name>
     470      <label>Cluster ID</label>
     471      <description>A unique identifier for a Unigene entry</description>
     472      <class />
     473      <value />
     474    </parameter>
     475    <parameter>
     476      <name>decimalSeparator</name>
     477      <label>Decimal separator</label>
     478      <description>The decimal separator used in numeric values, if not specified dot is assumed.</description>
     479      <class>java.lang.String</class>
     480      <value>dot</value>
     481    </parameter>
     482    <parameter>
     483      <name>extendedColumnMapping.ilmnStrand</name>
     484      <label>Ilmn strand</label>
     485      <description>Strand definition of the SNP</description>
     486      <class>java.lang.String</class>
     487      <value>\IlmnStrand\</value>
     488    </parameter>
     489    <parameter>
     490      <name>extendedColumnMapping.snp</name>
     491      <label>SNP</label>
     492      <description>Type of SNP</description>
     493      <class>java.lang.String</class>
     494      <value>\SNP\</value>
     495    </parameter>
     496    <parameter>
     497      <name>extendedColumnMapping.startPosition</name>
     498      <label>Start position</label>
     499      <description>Start position</description>
     500      <class>java.lang.String</class>
     501      <value>\MapInfo\</value>
     502    </parameter>
     503    <parameter>
     504      <name>trimQuotes</name>
     505      <label>Remove quotes</label>
     506      <description>If true quotes (" or ') around data value will be removed.</description>
     507      <class>java.lang.Boolean</class>
     508      <value>true</value>
     509    </parameter>
     510    <parameter>
     511      <name>extendedColumnMapping.locusLink</name>
     512      <label>LocusLink</label>
     513      <description />
     514      <class />
     515      <value />
     516    </parameter>
     517    <parameter>
     518      <name>extendedColumnMapping.synonyms</name>
     519      <label>Synonyms</label>
     520      <description />
     521      <class />
     522      <value />
     523    </parameter>
     524    <parameter>
     525      <name>extendedColumnMapping.isoformType</name>
     526      <label>Isoform type</label>
     527      <description />
     528      <class />
     529      <value />
     530    </parameter>
     531    <parameter>
     532      <name>extendedColumnMapping.sourceReferenceId</name>
     533      <label>Source reference id</label>
     534      <description />
     535      <class />
     536      <value />
     537    </parameter>
     538    <parameter>
     539      <name>extendedColumnMapping.ilmnGene</name>
     540      <label>ILMN Gene</label>
     541      <description />
     542      <class />
     543      <value />
     544    </parameter>
     545    <parameter>
     546      <name>extendedColumnMapping.library</name>
     547      <label>Library</label>
     548      <description>The library from which the reporter is derived</description>
     549      <class />
     550      <value />
     551    </parameter>
     552    <parameter>
     553      <name>maxDataColumns</name>
     554      <label>Max data columns</label>
     555      <description>The maximum number of columns for a line to be counted as a data line, or 0 to allow any number of columns.</description>
     556      <class />
     557      <value />
     558    </parameter>
     559    <parameter>
     560      <name>extendedColumnMapping.chromosome</name>
     561      <label>Chromosome</label>
     562      <description>The chromosome from which the reporter is derived</description>
     563      <class>java.lang.String</class>
     564      <value>\Chr\</value>
     565    </parameter>
     566    <parameter>
     567      <name>symbolColumnMapping</name>
     568      <label>Gene symbol</label>
     569      <description>Mapping that picks the reporter's gene symbol from the data columns. For example: \Gene symbol\</description>
     570      <class />
     571      <value />
     572    </parameter>
     573    <parameter>
     574      <name>headerRegexp</name>
     575      <label>Header</label>
     576      <description>A regular expression that matches a header line and extracts the name and a value parts. For example, split on equal symbol: (.+)=(.*)</description>
     577      <class />
     578      <value />
     579    </parameter>
     580    <parameter>
     581      <name>scoreColumnMapping</name>
     582      <label>Score</label>
     583      <description>Mapping that picks the reporter's score in some context. This mapping is only used when importing to a reporter list.</description>
     584      <class />
     585      <value />
     586    </parameter>
     587    <parameter>
     588      <name>dataHeaderRegexp</name>
     589      <label>Data header</label>
     590      <description>A regular expression that matches the header line just before the data begins. For example: Block\tRow\tColumn.*</description>
     591      <class>java.lang.String</class>
     592      <value>IlmnID,.*AddressA_ID.*</value>
     593    </parameter>
     594    <parameter>
     595      <name>extendedColumnMapping.controlCompositeMap</name>
     596      <label>Control composite map</label>
     597      <description />
     598      <class />
     599      <value />
     600    </parameter>
     601    <parameter>
     602      <name>reporterType</name>
     603      <label>Reporter type</label>
     604      <description>The reporter type assigned to the imported reporters</description>
     605      <class />
     606      <value />
     607    </parameter>
     608    <parameter>
     609      <name>extendedColumnMapping.length</name>
     610      <label>Length</label>
     611      <description>The length of the sequence</description>
     612      <class />
     613      <value />
     614    </parameter>
     615    <parameter>
     616      <name>extendedColumnMapping.probeChrOrientation</name>
     617      <label>Probe chr orientation</label>
     618      <description />
     619      <class />
     620      <value />
     621    </parameter>
     622    <parameter>
     623      <name>reporterTypeColumnMapping</name>
     624      <label>Reporter type</label>
     625      <description>Mapping that pick the reporter's type from the data columns. This will overide the reporter type parameter. For example: \Reporter type\</description>
     626      <class />
     627      <value />
     628    </parameter>
     629    <parameter>
     630      <name>complexExpressions</name>
     631      <label>Complex column mappings</label>
     632      <description>disallow = Only allow simple mappings that are constant value or pick the value from one column only, for example, '1.6' or '\Row\'
     633allow = Allow expression and complex mappings, for example, '\Row\, \Column\' or '=2*col('radius')'</description>
     634      <class>java.lang.String</class>
     635      <value>disallow</value>
     636    </parameter>
     637    <parameter>
     638      <name>extendedColumnMapping.controlGroupName</name>
     639      <label>Control group name</label>
     640      <description />
     641      <class />
     642      <value />
     643    </parameter>
     644    <parameter>
     645      <name>charset</name>
     646      <label>Character set</label>
     647      <description>The character set used in the file, if not specified the default character set is used (ISO-8859-1).</description>
     648      <class>java.lang.String</class>
     649      <value>ISO-8859-1</value>
     650    </parameter>
     651    <parameter>
     652      <name>extendedColumnMapping.probeCoordinates</name>
     653      <label>Probe coordinates</label>
     654      <description />
     655      <class />
     656      <value />
     657    </parameter>
     658    <parameter>
     659      <name>extendedColumnMapping.controlGroupId</name>
     660      <label>Control group id</label>
     661      <description />
     662      <class />
     663      <value />
     664    </parameter>
     665    <parameter>
     666      <name>dataSplitterRegexp</name>
     667      <label>Data splitter</label>
     668      <description>A regular expression that splits each data line into individual columns. For example, split on tabs: \t</description>
     669      <class>java.lang.String</class>
     670      <value>,</value>
     671    </parameter>
     672    <parameter>
     673      <name>extendedColumnMapping.antibiotics</name>
     674      <label>Antibiotics</label>
     675      <description />
     676      <class />
     677      <value />
     678    </parameter>
     679    <parameter>
     680      <name>reporterIdColumnMapping</name>
     681      <label>Reporter ID</label>
     682      <description>Mapping that picks the reporter's ID from the data columns. For example: \ID\</description>
     683      <class>java.lang.String</class>
     684      <value>\IlmnID\</value>
     685    </parameter>
     686    <parameter>
     687      <name>extendedColumnMapping.species</name>
     688      <label>Species</label>
     689      <description>The organism from which the reporter is derived</description>
     690      <class>java.lang.String</class>
     691      <value>\Species\</value>
     692    </parameter>
     693    <parameter>
     694      <name>extendedColumnMapping.sequence</name>
     695      <label>Sequence</label>
     696      <description>The nucleotide sequence of the reporter</description>
     697      <class />
     698      <value />
     699    </parameter>
     700    <parameter>
     701      <name>nameColumnMapping</name>
     702      <label>Name</label>
     703      <description>Mapping that picks the reporter's name from the data columns. For example: \Name\</description>
     704      <class>java.lang.String</class>
     705      <value>\Name\</value>
     706    </parameter>
     707    <parameter>
     708      <name>extendedColumnMapping.vector</name>
     709      <label>Vector</label>
     710      <description>The vector from which the reporter is derived</description>
     711      <class />
     712      <value />
     713    </parameter>
     714    <parameter>
     715      <name>extendedColumnMapping.nid</name>
     716      <label>NID</label>
     717      <description />
     718      <class />
     719      <value />
     720    </parameter>
     721  </configuration>
    388722</configfile>
  • plugins/base2/net.sf.basedb.illumina/trunk/META-INF/base-plugins.xml

    r617 r624  
    2222    <hasconfigurations/>
    2323    </pluginclass>
    24     <!-- 
    25   <pluginclass classname="net.sf.basedb.illumina.plugins.ScanDataImporter">
     24    <pluginclass classname="net.sf.basedb.illumina.plugins.SnpIntensityCalculator">
    2625    <minbaseversion>2.6</minbaseversion>
    2726    <hasconfigurations/>
    2827    </pluginclass>
    29     -->
     28  <pluginclass classname="net.sf.basedb.illumina.plugins.SnpReporterImporter">
     29    <minbaseversion>2.6</minbaseversion>
     30    <hasconfigurations>yes</hasconfigurations>
     31    </pluginclass>
    3032</plugins>
  • plugins/base2/net.sf.basedb.illumina/trunk/config/illumina-extended-properties.xml

    r589 r624  
    113113      length="255"
    114114    />
     115    <property
     116      name="startPosition"
     117      title="Start position"
     118      column="startPosition"
     119      type="int"
     120    />
    115121  </class>
    116122</extended-properties>
  • plugins/base2/net.sf.basedb.illumina/trunk/src/net/sf/basedb/illumina/Illumina.java

    r590 r624  
    122122  }
    123123 
     124  /**
     125    Get the {@link RawDataType} representing the Illumina SNP
     126    raw data type.
     127    @return A raw data type (null if this type is not present)
     128  */
     129  public static final RawDataType getSnpType()
     130  {
     131    return RawDataTypes.getRawDataType("variant." + SNP_VARIANT_ID);
     132  }
    124133 
    125134}
Note: See TracChangeset for help on using the changeset viewer.